neuralbioinfo
/

prokbert-mini

sequence embedding

genomic language models

promoter-prediction

Model card Files Files and versions

ligeti commited on Jan 24, 2024

Commit

8d9d971

·

verified ·

1 Parent(s): 32d3f0e

Update README.md

Files changed (1) hide show

README.md +6 -1

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ tokenization_parameters = {
 }
 # Initialize the tokenizer and model
 tokenizer = ProkBERTTokenizer(tokenization_params=tokenization_parameters, operation_space='sequence')
-model = MegatronBertForMaskedLM.from_pretrained("nerualbioinfo/prokbert-mini-k6s2")
 # Example DNA sequence
 sequence = 'ATGTCCGCGGGACCT'
 # Tokenize the sequence
@@ -52,6 +52,11 @@ outputs = model(**inputs)
 | Layers               | 6                                    |
 | Attention Heads      | 6                                    |
 ## Segmentation and Tokenization in ProkBERT Models

 }
 # Initialize the tokenizer and model
 tokenizer = ProkBERTTokenizer(tokenization_params=tokenization_parameters, operation_space='sequence')
+model = MegatronBertForMaskedLM.from_pretrained("nerualbioinfo/prokbert-mini-k6s1")
 # Example DNA sequence
 sequence = 'ATGTCCGCGGGACCT'
 # Tokenize the sequence
 | Layers               | 6                                    |
 | Attention Heads      | 6                                    |
+### Intended Use
+**Intended Use Cases:** ProkBERT-mini-k6-s1 is intended for bioinformatics researchers and practitioners focusing on genomic sequence analysis, including:
+- sequence classification tasks
+- Exploration of genomic patterns and features
 ## Segmentation and Tokenization in ProkBERT Models