Safetensors
mmokoatle commited on
Commit
ac3f9e9
·
verified ·
1 Parent(s): 0896187

Add new SentenceTransformer model.

Browse files
0_SentenceTransformer/1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
0_SentenceTransformer/README.md ADDED
@@ -0,0 +1,108 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: apache-2.0
3
+ library_name: sentence-transformers
4
+ tags:
5
+ - sentence-transformers
6
+ - feature-extraction
7
+ - sentence-similarity
8
+ - transformers
9
+ pipeline_tag: sentence-similarity
10
+ ---
11
+
12
+ # sentence-transformers/paraphrase-mpnet-base-v2
13
+
14
+ This is a [sentence-transformers](https://www.SBERT.net) model: It maps sentences & paragraphs to a 768 dimensional dense vector space and can be used for tasks like clustering or semantic search.
15
+
16
+
17
+
18
+ ## Usage (Sentence-Transformers)
19
+
20
+ Using this model becomes easy when you have [sentence-transformers](https://www.SBERT.net) installed:
21
+
22
+ ```
23
+ pip install -U sentence-transformers
24
+ ```
25
+
26
+ Then you can use the model like this:
27
+
28
+ ```python
29
+ from sentence_transformers import SentenceTransformer
30
+ sentences = ["This is an example sentence", "Each sentence is converted"]
31
+
32
+ model = SentenceTransformer('sentence-transformers/paraphrase-mpnet-base-v2')
33
+ embeddings = model.encode(sentences)
34
+ print(embeddings)
35
+ ```
36
+
37
+
38
+
39
+ ## Usage (HuggingFace Transformers)
40
+ Without [sentence-transformers](https://www.SBERT.net), you can use the model like this: First, you pass your input through the transformer model, then you have to apply the right pooling-operation on-top of the contextualized word embeddings.
41
+
42
+ ```python
43
+ from transformers import AutoTokenizer, AutoModel
44
+ import torch
45
+
46
+
47
+ #Mean Pooling - Take attention mask into account for correct averaging
48
+ def mean_pooling(model_output, attention_mask):
49
+ token_embeddings = model_output[0] #First element of model_output contains all token embeddings
50
+ input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
51
+ return torch.sum(token_embeddings * input_mask_expanded, 1) / torch.clamp(input_mask_expanded.sum(1), min=1e-9)
52
+
53
+
54
+ # Sentences we want sentence embeddings for
55
+ sentences = ['This is an example sentence', 'Each sentence is converted']
56
+
57
+ # Load model from HuggingFace Hub
58
+ tokenizer = AutoTokenizer.from_pretrained('sentence-transformers/paraphrase-mpnet-base-v2')
59
+ model = AutoModel.from_pretrained('sentence-transformers/paraphrase-mpnet-base-v2')
60
+
61
+ # Tokenize sentences
62
+ encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')
63
+
64
+ # Compute token embeddings
65
+ with torch.no_grad():
66
+ model_output = model(**encoded_input)
67
+
68
+ # Perform pooling. In this case, max pooling.
69
+ sentence_embeddings = mean_pooling(model_output, encoded_input['attention_mask'])
70
+
71
+ print("Sentence embeddings:")
72
+ print(sentence_embeddings)
73
+ ```
74
+
75
+
76
+
77
+ ## Evaluation Results
78
+
79
+
80
+
81
+ For an automated evaluation of this model, see the *Sentence Embeddings Benchmark*: [https://seb.sbert.net](https://seb.sbert.net?model_name=sentence-transformers/paraphrase-mpnet-base-v2)
82
+
83
+
84
+
85
+ ## Full Model Architecture
86
+ ```
87
+ SentenceTransformer(
88
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: MPNetModel
89
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False})
90
+ )
91
+ ```
92
+
93
+ ## Citing & Authors
94
+
95
+ This model was trained by [sentence-transformers](https://www.sbert.net/).
96
+
97
+ If you find this model helpful, feel free to cite our publication [Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks](https://arxiv.org/abs/1908.10084):
98
+ ```bibtex
99
+ @inproceedings{reimers-2019-sentence-bert,
100
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
101
+ author = "Reimers, Nils and Gurevych, Iryna",
102
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
103
+ month = "11",
104
+ year = "2019",
105
+ publisher = "Association for Computational Linguistics",
106
+ url = "http://arxiv.org/abs/1908.10084",
107
+ }
108
+ ```
0_SentenceTransformer/config.json ADDED
@@ -0,0 +1,24 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "/home/mphomokoatle64/bucket/fp10Nov/0_SentenceTransformer",
3
+ "architectures": [
4
+ "MPNetModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "eos_token_id": 2,
9
+ "hidden_act": "gelu",
10
+ "hidden_dropout_prob": 0.1,
11
+ "hidden_size": 768,
12
+ "initializer_range": 0.02,
13
+ "intermediate_size": 3072,
14
+ "layer_norm_eps": 1e-05,
15
+ "max_position_embeddings": 514,
16
+ "model_type": "mpnet",
17
+ "num_attention_heads": 12,
18
+ "num_hidden_layers": 12,
19
+ "pad_token_id": 1,
20
+ "relative_attention_num_buckets": 32,
21
+ "torch_dtype": "float32",
22
+ "transformers_version": "4.43.4",
23
+ "vocab_size": 30527
24
+ }
0_SentenceTransformer/config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.43.4",
5
+ "pytorch": "2.4.0+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
0_SentenceTransformer/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:bbd45b26e8f0c2590a2c2f8b9228d9068cb58f0e29318d9bec62e98ba54a82c3
3
+ size 437967672
0_SentenceTransformer/modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
0_SentenceTransformer/sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
0_SentenceTransformer/special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
0_SentenceTransformer/tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
0_SentenceTransformer/tokenizer_config.json ADDED
@@ -0,0 +1,62 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[UNK]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "[PAD]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "4": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": true,
45
+ "cls_token": "[CLS]",
46
+ "do_lower_case": true,
47
+ "mask_token": "[MASK]",
48
+ "max_length": 512,
49
+ "model_max_length": 512,
50
+ "pad_to_multiple_of": null,
51
+ "pad_token": "[PAD]",
52
+ "pad_token_type_id": 0,
53
+ "padding_side": "right",
54
+ "sep_token": "[SEP]",
55
+ "stride": 0,
56
+ "strip_accents": null,
57
+ "tokenize_chinese_chars": true,
58
+ "tokenizer_class": "BertTokenizer",
59
+ "truncation_side": "right",
60
+ "truncation_strategy": "longest_first",
61
+ "unk_token": "[UNK]"
62
+ }
0_SentenceTransformer/vocab.txt ADDED
@@ -0,0 +1,4509 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [UNK]
2
+ [PAD]
3
+ [CLS]
4
+ [SEP]
5
+ [MASK]
6
+ a
7
+ c
8
+ e
9
+ g
10
+ n
11
+ q
12
+ s
13
+ t
14
+ u
15
+ ##t
16
+ ##g
17
+ ##c
18
+ ##a
19
+ ##e
20
+ ##q
21
+ ##u
22
+ ##n
23
+ ##s
24
+ ##cg
25
+ ##aa
26
+ ##tt
27
+ ##gg
28
+ ##cc
29
+ ##ca
30
+ ##tg
31
+ ##ag
32
+ ##ct
33
+ ##at
34
+ ##ccg
35
+ cg
36
+ gg
37
+ ##cgg
38
+ ##ac
39
+ tg
40
+ ag
41
+ ##tc
42
+ ##cag
43
+ ##tcg
44
+ ##ta
45
+ ##aag
46
+ ##ttg
47
+ ##agg
48
+ ##tgg
49
+ ##ctg
50
+ ##acg
51
+ cgg
52
+ ##caa
53
+ ##ctt
54
+ gcg
55
+ ##acc
56
+ ##tcc
57
+ ##att
58
+ ##atg
59
+ ccg
60
+ ##cgc
61
+ tcg
62
+ ##ttt
63
+ ggg
64
+ tgg
65
+ agg
66
+ gcc
67
+ ##tca
68
+ aaa
69
+ ##taa
70
+ ##cga
71
+ ##aaa
72
+ ##tct
73
+ ##cca
74
+ gaa
75
+ cag
76
+ caa
77
+ ttt
78
+ acg
79
+ ##ctc
80
+ ctg
81
+ ##tag
82
+ gag
83
+ ##ccc
84
+ aag
85
+ ##aca
86
+ ##cct
87
+ ttg
88
+ ##ttc
89
+ ##ccgg
90
+ ##tgc
91
+ ctt
92
+ tcc
93
+ ##ggc
94
+ ##agc
95
+ acc
96
+ ##atc
97
+ ##cgt
98
+ gct
99
+ ccc
100
+ ##act
101
+ ##aat
102
+ att
103
+ atg
104
+ ##cat
105
+ ##aac
106
+ gtg
107
+ gca
108
+ gtt
109
+ gat
110
+ ##cac
111
+ gccg
112
+ cca
113
+ ##tat
114
+ ##tga
115
+ taa
116
+ cct
117
+ ##cggc
118
+ ggcg
119
+ cat
120
+ ##gga
121
+ aat
122
+ cgcg
123
+ tca
124
+ ##aga
125
+ ##ggt
126
+ ##ggg
127
+ ##ccgc
128
+ gcgg
129
+ tct
130
+ ##tta
131
+ ##tgt
132
+ ##ata
133
+ tag
134
+ cgcc
135
+ ccgg
136
+ ##cta
137
+ tat
138
+ ##agt
139
+ aca
140
+ ctgg
141
+ cagg
142
+ gtcg
143
+ ctcg
144
+ gagg
145
+ act
146
+ ##tac
147
+ gacg
148
+ cccg
149
+ cggg
150
+ ##cagc
151
+ ##ccga
152
+ gctg
153
+ cgag
154
+ tcgg
155
+ agcg
156
+ gaag
157
+ gtgg
158
+ ##cttg
159
+ atcg
160
+ gcag
161
+ ga
162
+ aagg
163
+ ##caag
164
+ accg
165
+ ccag
166
+ gatg
167
+ ggcc
168
+ tta
169
+ cctg
170
+ ca
171
+ ggtg
172
+ tcaa
173
+ ttcg
174
+ gctt
175
+ gcaa
176
+ ttgg
177
+ atgg
178
+ ##tcgg
179
+ cacc
180
+ tgcg
181
+ ata
182
+ tccg
183
+ aatt
184
+ aaag
185
+ cgaa
186
+ tctt
187
+ agaa
188
+ cta
189
+ cacg
190
+ gta
191
+ acgg
192
+ ggaa
193
+ ttc
194
+ tgaa
195
+ ggag
196
+ ctcc
197
+ ##ccgt
198
+ tttg
199
+ gacc
200
+ aa
201
+ tgcc
202
+ ttcc
203
+ ##ccggc
204
+ cgct
205
+ cctt
206
+ ccaa
207
+ agcc
208
+ gggg
209
+ gttg
210
+ cttg
211
+ cgtg
212
+ cgat
213
+ atc
214
+ gt
215
+ gatt
216
+ ct
217
+ caag
218
+ acaa
219
+ at
220
+ ataa
221
+ atcc
222
+ tatt
223
+ ggca
224
+ attg
225
+ tt
226
+ aacg
227
+ aac
228
+ ggtt
229
+ tggg
230
+ tgtt
231
+ tcag
232
+ aggg
233
+ cgca
234
+ gtcc
235
+ agtt
236
+ aacc
237
+ cgtt
238
+ ttaa
239
+ agca
240
+ ##cggt
241
+ ##gc
242
+ tgct
243
+ actt
244
+ ggct
245
+ ctc
246
+ ##caga
247
+ catt
248
+ ##cgga
249
+ tgag
250
+ tctg
251
+ tgat
252
+ aatg
253
+ ttca
254
+ atca
255
+ agag
256
+ agct
257
+ ta
258
+ gtc
259
+ ##aagc
260
+ catg
261
+ ##aaga
262
+ ##ttga
263
+ ##ctgc
264
+ cgagg
265
+ ttct
266
+ acag
267
+ gtaa
268
+ gac
269
+ gtag
270
+ ggat
271
+ cgacg
272
+ ##ttgc
273
+ agat
274
+ cga
275
+ cgtcg
276
+ tttt
277
+ tacc
278
+ actg
279
+ ##cagt
280
+ atct
281
+ tgca
282
+ gtca
283
+ tac
284
+ tacg
285
+ atag
286
+ aaca
287
+ cac
288
+ aact
289
+ tagg
290
+ ttat
291
+ ctca
292
+ ctaa
293
+ cgccgc
294
+ atat
295
+ gcggcg
296
+ gaca
297
+ ##cttc
298
+ ctct
299
+ ##ttgt
300
+ tatg
301
+ ggtgg
302
+ agtg
303
+ ##aagt
304
+ ##atga
305
+ attt
306
+ ttag
307
+ taag
308
+ tgtg
309
+ ggtcg
310
+ ##ga
311
+ ##ccgga
312
+ ##ctga
313
+ ##atgc
314
+ ##ccggt
315
+ gccgcc
316
+ ggcggc
317
+ ccgccg
318
+ ##gt
319
+ cgacc
320
+ cggcgg
321
+ gtct
322
+ ggagg
323
+ gcgccg
324
+ cggcgc
325
+ cttt
326
+ gga
327
+ cgtgg
328
+ gcgcgc
329
+ gccgcg
330
+ cgcggc
331
+ ##caaa
332
+ ##cttt
333
+ ##caagc
334
+ ##attt
335
+ tga
336
+ gact
337
+ ctat
338
+ cgcgcg
339
+ cgcgcc
340
+ cggcga
341
+ ccggcg
342
+ cgccgg
343
+ tcgccg
344
+ ggcgcg
345
+ ##tccg
346
+ caca
347
+ tact
348
+ ##cttgc
349
+ gccggc
350
+ taca
351
+ cgccga
352
+ cact
353
+ cggccg
354
+ tcggcg
355
+ ccgcgc
356
+ ggacg
357
+ gcgcgg
358
+ ##caac
359
+ ##cttga
360
+ gtat
361
+ gttt
362
+ ggta
363
+ ##tcggt
364
+ cgtcc
365
+ ##caat
366
+ cgcccg
367
+ ##ctgt
368
+ ##caaga
369
+ cgggcg
370
+ aga
371
+ ##atgt
372
+ cgta
373
+ agta
374
+ tgta
375
+ ggccgc
376
+ gcggcc
377
+ ctag
378
+ ##tcaa
379
+ ##acaa
380
+ tgagg
381
+ gcccgc
382
+ ##tcag
383
+ gcgggc
384
+ gccgag
385
+ ctcggc
386
+ ##tctt
387
+ cgacga
388
+ gcgcga
389
+ ##tcgga
390
+ ##taaa
391
+ agagg
392
+ tcgcgc
393
+ cgagcg
394
+ tcgtcg
395
+ tgacg
396
+ cgctcg
397
+ ccggcc
398
+ ##tcat
399
+ ggccgg
400
+ ggcgag
401
+ ggcgcc
402
+ ##cttgt
403
+ ctcgcc
404
+ gccgac
405
+ tgtcg
406
+ cccggc
407
+ gtcggc
408
+ gccggg
409
+ ##attc
410
+ ##taga
411
+ acgccg
412
+ ##actt
413
+ gcgacg
414
+ ##acat
415
+ ##tcac
416
+ cgtcgc
417
+ cggcgt
418
+ cgacgc
419
+ ccgcgg
420
+ agcgcg
421
+ gcgtcg
422
+ gagcgc
423
+ ggcgac
424
+ ##tctc
425
+ ccgccc
426
+ tcgacg
427
+ acggcg
428
+ cgtcga
429
+ ##tagc
430
+ gtcgcc
431
+ gacggc
432
+ cgcgct
433
+ gcgctc
434
+ cagcgc
435
+ ##tacaa
436
+ cccgcc
437
+ gggcgg
438
+ cgccgt
439
+ gccgtc
440
+ tgtgg
441
+ ggcggg
442
+ tgacc
443
+ gcgagc
444
+ gcgctg
445
+ gcgccc
446
+ gctcgc
447
+ cgatcg
448
+ ##atta
449
+ ccgcga
450
+ gggcgc
451
+ gcccgg
452
+ ccgggc
453
+ ccgacg
454
+ gatcgc
455
+ gcgatc
456
+ tcgcgg
457
+ ##tctg
458
+ cccgcg
459
+ ##tactt
460
+ ##taat
461
+ cgtcgg
462
+ gctcga
463
+ agtgg
464
+ ##caagt
465
+ cgcggg
466
+ tcgagc
467
+ agacg
468
+ cgaccg
469
+ ggccga
470
+ cgacgg
471
+ gccagc
472
+ tcggcc
473
+ cggtcg
474
+ ccgtcg
475
+ gcagcg
476
+ ccgagc
477
+ gcgcag
478
+ gctggc
479
+ ctcgac
480
+ cgcgac
481
+ ctgcgc
482
+ cgaggc
483
+ gtcgag
484
+ gacgcc
485
+ agcgcc
486
+ gcctcg
487
+ cgctgc
488
+ agcagc
489
+ gctcgg
490
+ ##actg
491
+ atcgcc
492
+ ggcgat
493
+ agcggc
494
+ ##aaaca
495
+ cgcgca
496
+ aaaaaa
497
+ gtcgcg
498
+ ggcgtc
499
+ cagcag
500
+ tgcgcg
501
+ gcggca
502
+ ##acac
503
+ gccgct
504
+ ggcgct
505
+ gctgct
506
+ agccgc
507
+ tgccgc
508
+ gggcga
509
+ cgcgag
510
+ ctgctg
511
+ tcgccc
512
+ gcggct
513
+ accggc
514
+ cgagca
515
+ cgcctc
516
+ ccagcg
517
+ ctcgcg
518
+ gaggcg
519
+ gagcag
520
+ gcgagg
521
+ ##aaact
522
+ ggtcc
523
+ gccggt
524
+ cctcgc
525
+ ccggca
526
+ cgagga
527
+ tgctcg
528
+ cgctgg
529
+ ccgcca
530
+ ggacc
531
+ agtcg
532
+ cctcga
533
+ cggcca
534
+ cgcagc
535
+ tcgagg
536
+ cagccg
537
+ ##tactg
538
+ ctgctc
539
+ gcagca
540
+ tgccgg
541
+ tcctcg
542
+ cggctg
543
+ gctgcg
544
+ cggccc
545
+ accgcc
546
+ tggcgg
547
+ tggccg
548
+ ##tagt
549
+ gccgga
550
+ gacgcg
551
+ tccggc
552
+ aggccg
553
+ gggccg
554
+ caccgc
555
+ cgcgtc
556
+ cgccag
557
+ tgctgc
558
+ gacgag
559
+ agacc
560
+ ggcagc
561
+ ggcggt
562
+ aaaaat
563
+ ctcgtc
564
+ cggcct
565
+ gctgcc
566
+ gaagaa
567
+ cggcag
568
+ tcgacc
569
+ ggtcga
570
+ gcgacc
571
+ gcggtg
572
+ cggctc
573
+ accgcg
574
+ ccgagg
575
+ gaccgc
576
+ ctggcg
577
+ gagccg
578
+ ctgccg
579
+ ##tatc
580
+ ccgctc
581
+ gcaggc
582
+ ggtcgc
583
+ gcgcca
584
+ ##ctta
585
+ aggcgg
586
+ cctcgg
587
+ acgcgc
588
+ gagcgg
589
+ cgcggt
590
+ gacgac
591
+ gcctgc
592
+ gcggtc
593
+ gaaaaa
594
+ gcgcgt
595
+ cggcaa
596
+ ##catat
597
+ ccgcct
598
+ gccgat
599
+ cgagcc
600
+ agcagg
601
+ ggcccg
602
+ agccgg
603
+ atcggc
604
+ tccgcc
605
+ ggcgga
606
+ gtcgtc
607
+ cgggcc
608
+ cggcac
609
+ ccggct
610
+ tttttt
611
+ ggctcg
612
+ caggcg
613
+ tggcgc
614
+ ccgacc
615
+ ccagca
616
+ aggcgc
617
+ tgtcc
618
+ ##ccaca
619
+ gcgcct
620
+ cgcctg
621
+ gtgccg
622
+ gcccga
623
+ gccgaa
624
+ ttgccg
625
+ ggtcgg
626
+ gccgca
627
+ acgacg
628
+ cctgct
629
+ cgccac
630
+ tccgcg
631
+ ttcttc
632
+ gaaggc
633
+ cgcgga
634
+ ccagcc
635
+ tgctgg
636
+ agctcg
637
+ ggcgaa
638
+ tgcggc
639
+ gccccg
640
+ cgagct
641
+ cgtcgt
642
+ tcgggc
643
+ gcagcc
644
+ ggcgca
645
+ ggctgg
646
+ cgaagc
647
+ ttcggc
648
+ tgcgcc
649
+ gcaccg
650
+ cgcccc
651
+ ##taag
652
+ gtggcg
653
+ ggctgc
654
+ aggtcg
655
+ agggcg
656
+ attttt
657
+ ttcgcc
658
+ cgacct
659
+ tgccga
660
+ cggggc
661
+ gccacc
662
+ cggtgc
663
+ cgcagg
664
+ gctgga
665
+ tcggca
666
+ gcttcg
667
+ cagcgg
668
+ cacgcc
669
+ gcgaag
670
+ tccagc
671
+ acctcg
672
+ cgccct
673
+ ggggcg
674
+ gaagcc
675
+ gcgatg
676
+ cgggca
677
+ cctgcg
678
+ accagc
679
+ ccgctg
680
+ catcgc
681
+ gccttc
682
+ cgaggt
683
+ ggtggc
684
+ ccaccg
685
+ aaaaag
686
+ atcgcg
687
+ ggcgtg
688
+ cgcgat
689
+ tgcccg
690
+ cgccca
691
+ gcagga
692
+ cttcgc
693
+ gaagcg
694
+ caaaaa
695
+ ggcttc
696
+ aagccg
697
+ gagctg
698
+ cggtgg
699
+ cagctc
700
+ gctggt
701
+ ggccag
702
+ tgggcg
703
+ cgcttc
704
+ caccgg
705
+ ccccgc
706
+ ##ccact
707
+ gaccgg
708
+ tcaccg
709
+ cacggc
710
+ cggacg
711
+ ccggtc
712
+ cgaaga
713
+ aagaag
714
+ tttttc
715
+ ccggtg
716
+ cggtga
717
+ cgtccg
718
+ gaggag
719
+ ctggcc
720
+ cggctt
721
+ tcctgc
722
+ tcgcca
723
+ gcgggg
724
+ atgccg
725
+ aaggcg
726
+ cgatga
727
+ tggcga
728
+ gcatcg
729
+ cggcat
730
+ cagcac
731
+ gccgtg
732
+ gatcga
733
+ gatgcc
734
+ cgctcc
735
+ cgatgc
736
+ acgtcg
737
+ cgacca
738
+ ggcatc
739
+ aaaatt
740
+ gcgcac
741
+ cgacgt
742
+ aaagaa
743
+ gtgcgc
744
+ gcaggt
745
+ ctcctc
746
+ ggagcg
747
+ acctgc
748
+ tcatcg
749
+ ggcagg
750
+ tcgatc
751
+ gccagg
752
+ ##taac
753
+ agcccg
754
+ gatgaa
755
+ tcttcg
756
+ cctgcc
757
+ aagaaa
758
+ acgagc
759
+ taaaaa
760
+ tggtcg
761
+ gtgctg
762
+ cgaagg
763
+ gccatc
764
+ gatggc
765
+ cgcacc
766
+ ccgaag
767
+ tcgaag
768
+ cgcctt
769
+ ccgcag
770
+ cctggc
771
+ acgcgg
772
+ ccgcgt
773
+ agaaaa
774
+ ccaggc
775
+ agctgc
776
+ ggtgcg
777
+ gcagct
778
+ gctcgt
779
+ cgggct
780
+ acggcc
781
+ ctgcgg
782
+ gaggcc
783
+ ctccgc
784
+ gcacgc
785
+ gcggag
786
+ aatttt
787
+ atcagc
788
+ cttcga
789
+ gcctgg
790
+ acccgc
791
+ gagggc
792
+ cagggc
793
+ ggcctc
794
+ aggcga
795
+ gcgtgc
796
+ cttctt
797
+ cttcgg
798
+ aaaata
799
+ gctgat
800
+ agtcc
801
+ cgatca
802
+ gccctc
803
+ ggacga
804
+ ccttcg
805
+ ggccgt
806
+ acgccc
807
+ ccacca
808
+ catcga
809
+ gtcgac
810
+ aaaaac
811
+ gcccag
812
+ aaaatc
813
+ gcgggt
814
+ ggcacg
815
+ gccctg
816
+ tttttg
817
+ tcgtcc
818
+ tgatcg
819
+ ##catac
820
+ ttcatc
821
+ cgcgaa
822
+ cagccc
823
+ ccccgg
824
+ caggcc
825
+ atcgag
826
+ cccgac
827
+ ctgggc
828
+ cgtgcc
829
+ aaaaga
830
+ gggcag
831
+ gggcgt
832
+ ggacgc
833
+ ##acta
834
+ tcgcct
835
+ cttttt
836
+ ggcaag
837
+ tggtgg
838
+ ccgatc
839
+ tgaaaa
840
+ ccgggg
841
+ tcgatg
842
+ gcggac
843
+ ctgccc
844
+ gccacg
845
+ gcgtcc
846
+ gtccgc
847
+ ctcgat
848
+ agaaga
849
+ ##tata
850
+ ggcctg
851
+ tgaaga
852
+ atggcg
853
+ gtcggg
854
+ gatcgg
855
+ gatgat
856
+ ##tcta
857
+ cgccat
858
+ cgaggg
859
+ cgatcc
860
+ aaattt
861
+ caggtc
862
+ aagcgc
863
+ cgcacg
864
+ gggctg
865
+ gacctg
866
+ cgtgcg
867
+ gaagat
868
+ gacctc
869
+ ttcttt
870
+ cgtggc
871
+ ccctcg
872
+ ggatcg
873
+ aaaagc
874
+ ##cctac
875
+ gaggtc
876
+ ccgtcc
877
+ atcatc
878
+ atccgc
879
+ ggacgg
880
+ ttcgcg
881
+ tgatga
882
+ gatttt
883
+ cgaccc
884
+ tttctt
885
+ ccatcg
886
+ ggcacc
887
+ cgcatc
888
+ ctccgg
889
+ cgatgg
890
+ ataaaa
891
+ cttgcc
892
+ agcacc
893
+ gctccg
894
+ ttttta
895
+ ccggag
896
+ gcggga
897
+ gcaaaa
898
+ agctgg
899
+ gcggat
900
+ ccgatg
901
+ ggaaga
902
+ cggagc
903
+ tcaaaa
904
+ gaccag
905
+ gatgcg
906
+ cgccaa
907
+ tcccgc
908
+ gcgctt
909
+ gcctcc
910
+ cccagc
911
+ acgagg
912
+ aagctg
913
+ caccag
914
+ ggaaaa
915
+ ggtgcc
916
+ ggaggc
917
+ catcgg
918
+ tcagcg
919
+ agccga
920
+ caggaa
921
+ cgctga
922
+ gacgat
923
+ atcgtc
924
+ gggtcg
925
+ agcggg
926
+ gctggg
927
+ gacccg
928
+ ccagct
929
+ gcacgg
930
+ gctgca
931
+ cccgct
932
+ ccacgc
933
+ tatttt
934
+ ttttct
935
+ tcatca
936
+ cctcgt
937
+ ctccag
938
+ ctggag
939
+ tgcagc
940
+ atcttc
941
+ ggtgct
942
+ tccagg
943
+ ccgtgc
944
+ cctgga
945
+ ttgaag
946
+ tcttca
947
+ cgggtc
948
+ caccga
949
+ acccgg
950
+ acgacc
951
+ gaaaat
952
+ caccac
953
+ gctgaa
954
+ ggaagc
955
+ accacc
956
+ ctggtg
957
+ ccagga
958
+ ttgaaa
959
+ ccgcac
960
+ ctcgaa
961
+ ctggtc
962
+ gcgtgg
963
+ cacccg
964
+ cagctt
965
+ tcggct
966
+ aataaa
967
+ gcggaa
968
+ catcaa
969
+ ggtgga
970
+ ccgggt
971
+ cttcaa
972
+ atcacc
973
+ ttggcg
974
+ tgcagg
975
+ tcagca
976
+ aacggc
977
+ gagaag
978
+ tgctga
979
+ aggaag
980
+ gcaggg
981
+ tcttct
982
+ gcttcc
983
+ gtgcgg
984
+ cccgca
985
+ tccacc
986
+ aacgcc
987
+ gaagag
988
+ acgggc
989
+ ttgatg
990
+ cgggtg
991
+ tcttcc
992
+ agcacg
993
+ gtggtg
994
+ cctgca
995
+ agaagc
996
+ tcggtg
997
+ ggcaaa
998
+ ttcgag
999
+ ggtcgt
1000
+ cgagat
1001
+ ggtgat
1002
+ ggtggt
1003
+ ttttca
1004
+ gcccgt
1005
+ ttccgc
1006
+ gcacga
1007
+ ttcagc
1008
+ gttttt
1009
+ ttcctg
1010
+ ggagga
1011
+ tcctgg
1012
+ tgcggg
1013
+ cagcaa
1014
+ acga
1015
+ tgaagc
1016
+ gctttt
1017
+ aggagc
1018
+ ccggac
1019
+ aagcgg
1020
+ cagcga
1021
+ gaagct
1022
+ ccctgc
1023
+ acggca
1024
+ atcgac
1025
+ atctcg
1026
+ ttttga
1027
+ cccgtc
1028
+ caggag
1029
+ gcacca
1030
+ aggacg
1031
+ ctggaa
1032
+ gtccgg
1033
+ agatcg
1034
+ cggtca
1035
+ gaggtg
1036
+ aaataa
1037
+ gacggg
1038
+ ccaggt
1039
+ cacctc
1040
+ gaacgc
1041
+ gccgtt
1042
+ tgaccg
1043
+ acctgg
1044
+ cctccg
1045
+ ttttat
1046
+ cgtgct
1047
+ ggcgtt
1048
+ gcaagc
1049
+ gcttca
1050
+ cccgga
1051
+ cggagg
1052
+ ccggga
1053
+ tcgtgc
1054
+ tttcaa
1055
+ cccggg
1056
+ tctttt
1057
+ cgaacg
1058
+ cttctc
1059
+ gacgaa
1060
+ tcgcga
1061
+ ttcaaa
1062
+ tcctcc
1063
+ tcccgg
1064
+ ttttgc
1065
+ atgaag
1066
+ cccgag
1067
+ tttatt
1068
+ agcttc
1069
+ aggagg
1070
+ tccggg
1071
+ ccgctt
1072
+ caaaat
1073
+ gctcct
1074
+ tgaagg
1075
+ gaggaa
1076
+ cacgcg
1077
+ attttc
1078
+ gagatc
1079
+ cgtcca
1080
+ ctcttc
1081
+ gtcgat
1082
+ gcgaga
1083
+ tcgctg
1084
+ ttgctg
1085
+ gtcgaa
1086
+ gcgttc
1087
+ cgatct
1088
+ gcttct
1089
+ ttaaaa
1090
+ tggacg
1091
+ cgcgtg
1092
+ tggtgc
1093
+ accagg
1094
+ gagcac
1095
+ ttccag
1096
+ cgctca
1097
+ tggaag
1098
+ cttcct
1099
+ cgtcct
1100
+ ctcctg
1101
+ tttgaa
1102
+ cgttcg
1103
+ ggtgaa
1104
+ gcttgc
1105
+ ggagaa
1106
+ tgccgt
1107
+ accggg
1108
+ ttcgac
1109
+ ggctga
1110
+ ctcggg
1111
+ gctcca
1112
+ gctcaa
1113
+ tgagcg
1114
+ cccggt
1115
+ ttttcc
1116
+ ccccga
1117
+ tttgcc
1118
+ tcagcc
1119
+ gtcagc
1120
+ cgagaa
1121
+ gctgac
1122
+ aatatt
1123
+ cagcca
1124
+ agaagg
1125
+ tggagc
1126
+ tctcgc
1127
+ aaatat
1128
+ ggccac
1129
+ aaagcc
1130
+ ctcgag
1131
+ gatcag
1132
+ ttcgtc
1133
+ gtgctc
1134
+ gagcga
1135
+ gatctc
1136
+ ccatca
1137
+ gaaaag
1138
+ cggaag
1139
+ gcatca
1140
+ gaaatt
1141
+ cctcct
1142
+ tgatgg
1143
+ ggatga
1144
+ cctggt
1145
+ gaggac
1146
+ ggcaac
1147
+ caggtg
1148
+ ttcacc
1149
+ gaagac
1150
+ tgatgc
1151
+ cacctg
1152
+ tggctg
1153
+ gatccg
1154
+ cttcca
1155
+ acgatc
1156
+ ccggaa
1157
+ ttattt
1158
+ aaacaa
1159
+ gaagga
1160
+ atcaaa
1161
+ gtggcc
1162
+ attttg
1163
+ tcgctc
1164
+ ctgatc
1165
+ aacagc
1166
+ ttgagc
1167
+ aaaaca
1168
+ tgacga
1169
+ tcgggg
1170
+ gcgcaa
1171
+ cggatc
1172
+ gcagaa
1173
+ ccgcaa
1174
+ caacaa
1175
+ gcgaac
1176
+ gacgtc
1177
+ gatcgt
1178
+ cttccg
1179
+ atattt
1180
+ tcgtca
1181
+ acaaaa
1182
+ caaggc
1183
+ ttcctc
1184
+ ccttca
1185
+ aggtgc
1186
+ aaatca
1187
+ gtcctc
1188
+ aacaaa
1189
+ tcgaga
1190
+ cttcat
1191
+ aagcag
1192
+ gtgcag
1193
+ ttctcg
1194
+ ctgcac
1195
+ gggcaa
1196
+ ttctcc
1197
+ aaaacc
1198
+ tcatcc
1199
+ caggat
1200
+ ccgaga
1201
+ ttccgg
1202
+ agcgca
1203
+ gcacct
1204
+ gttgcc
1205
+ ttgcgc
1206
+ gatgac
1207
+ aatttc
1208
+ ttttaa
1209
+ atccgg
1210
+ gagctc
1211
+ tctcga
1212
+ gcaagg
1213
+ ccgaac
1214
+ agaaat
1215
+ cctcca
1216
+ atgcgc
1217
+ ccggat
1218
+ atgatg
1219
+ ggaagg
1220
+ gtcatc
1221
+ taat
1222
+ gcgcat
1223
+ ccgtca
1224
+ gtcttc
1225
+ ctgaag
1226
+ gttcgc
1227
+ ggagat
1228
+ cgggga
1229
+ tggagg
1230
+ aatcaa
1231
+ cgaaaa
1232
+ gaaggt
1233
+ tgacgg
1234
+ tccccg
1235
+ ttgcgg
1236
+ gaacag
1237
+ ccacga
1238
+ ggcttt
1239
+ acgaag
1240
+ atcctg
1241
+ ccacgg
1242
+ gcatcc
1243
+ tgattt
1244
+ ggatgc
1245
+ tttaaa
1246
+ ccaggg
1247
+ gaaagc
1248
+ gctgtt
1249
+ aagctc
1250
+ tctcgg
1251
+ gccttg
1252
+ aaattc
1253
+ acgctg
1254
+ atcccg
1255
+ ccaccc
1256
+ cagaag
1257
+ cagcgt
1258
+ gacgtg
1259
+ accccg
1260
+ tgcgct
1261
+ ttgttg
1262
+ ccttct
1263
+ gcagat
1264
+ ggagca
1265
+ gttcgg
1266
+ accgac
1267
+ aggtgg
1268
+ catccg
1269
+ tcacca
1270
+ cacgtc
1271
+ catcat
1272
+ ccaaaa
1273
+ aaaact
1274
+ ttctgc
1275
+ ttgccc
1276
+ catcac
1277
+ agccag
1278
+ gatgct
1279
+ agcatc
1280
+ gaattt
1281
+ ccgtgg
1282
+ caagct
1283
+ ##cctat
1284
+ aaagct
1285
+ tttgat
1286
+ ccagaa
1287
+ cggatg
1288
+ cgggat
1289
+ atgaaa
1290
+ gatgag
1291
+ aataat
1292
+ ccttgc
1293
+ atctcc
1294
+ caaagc
1295
+ tcaagg
1296
+ tggtga
1297
+ tcaagc
1298
+ tggaaa
1299
+ ccctgg
1300
+ aaattg
1301
+ gtcacc
1302
+ gggtgg
1303
+ gaccga
1304
+ ctgatg
1305
+ aaccgc
1306
+ ctgctt
1307
+ cttcag
1308
+ tggcaa
1309
+ tcgtgg
1310
+ gtgatg
1311
+ gagctt
1312
+ ctgcca
1313
+ cccagg
1314
+ agcgct
1315
+ ccacct
1316
+ gttgaa
1317
+ cccgaa
1318
+ agcttg
1319
+ gccaag
1320
+ catcag
1321
+ aggaga
1322
+ tgctcc
1323
+ ttgttt
1324
+ ttgatt
1325
+ attatt
1326
+ tggcag
1327
+ ggtgac
1328
+ caagaa
1329
+ atcagg
1330
+ tccttc
1331
+ ccttcc
1332
+ ccgaca
1333
+ gcttga
1334
+ caagcc
1335
+ caaaag
1336
+ cggaga
1337
+ cgggaa
1338
+ atctgc
1339
+ tgtttt
1340
+ ggcaat
1341
+ taaaat
1342
+ cggggt
1343
+ cctggg
1344
+ agcgtc
1345
+ ctgttc
1346
+ gaaatc
1347
+ accgtc
1348
+ aaagat
1349
+ ttgcca
1350
+ gtgaag
1351
+ gataaa
1352
+ ctggct
1353
+ gtcggt
1354
+ tttgtt
1355
+ aaatta
1356
+ gacatc
1357
+ atgctg
1358
+ attgcc
1359
+ ttttgt
1360
+ agcaaa
1361
+ atcaac
1362
+ ctgacc
1363
+ cttcgt
1364
+ cgtcac
1365
+ accatc
1366
+ accttc
1367
+ ggtcag
1368
+ ctggac
1369
+ tcggtc
1370
+ attgaa
1371
+ gtccag
1372
+ cgaaca
1373
+ tctccg
1374
+ gcggtt
1375
+ caacgc
1376
+ cagcat
1377
+ cttttc
1378
+ ctcatc
1379
+ gacggt
1380
+ atccag
1381
+ cctgat
1382
+ gacgct
1383
+ tcgaac
1384
+ gatggt
1385
+ ttcaac
1386
+ aggaaa
1387
+ ccttga
1388
+ ggagct
1389
+ acgatg
1390
+ ggtttt
1391
+ gttcga
1392
+ gttgat
1393
+ agctcc
1394
+ ggctcc
1395
+ ggagcc
1396
+ atttct
1397
+ tcaacg
1398
+ aaagca
1399
+ ttcccg
1400
+ ctcccg
1401
+ cgtccc
1402
+ attaaa
1403
+ gctttg
1404
+ aaaatg
1405
+ gtgacg
1406
+ catggc
1407
+ catcgt
1408
+ gctttc
1409
+ accacg
1410
+ agcttt
1411
+ cacgac
1412
+ gaacgg
1413
+ gcccac
1414
+ ggatgg
1415
+ aaatcc
1416
+ cctgaa
1417
+ ttctgg
1418
+ cttctg
1419
+ gggacg
1420
+ gtggag
1421
+ cgggag
1422
+ ctcacc
1423
+ cttcac
1424
+ tgtcgg
1425
+ gccatg
1426
+ gaggat
1427
+ ggtgag
1428
+ aaggaa
1429
+ aagatg
1430
+ ctgcaa
1431
+ ccatcc
1432
+ caattt
1433
+ ctccac
1434
+ accgag
1435
+ cgtgga
1436
+ tcagga
1437
+ agcaga
1438
+ ctggat
1439
+ aagggc
1440
+ gatgtc
1441
+ tgagca
1442
+ ggcttg
1443
+ gatttc
1444
+ gaaaac
1445
+ atttta
1446
+ gatgga
1447
+ gcaccc
1448
+ tccacg
1449
+ gcgtca
1450
+ tgcgca
1451
+ agcgag
1452
+ acgctc
1453
+ aggatg
1454
+ gaaaga
1455
+ gtgggc
1456
+ aaaagg
1457
+ cgttga
1458
+ ttgcag
1459
+ gcgttg
1460
+ cagctg
1461
+ gatcac
1462
+ ttcggg
1463
+ cttggc
1464
+ gagaaa
1465
+ ccgttc
1466
+ gcaaag
1467
+ tgctca
1468
+ ggcaga
1469
+ agtttt
1470
+ atcctc
1471
+ agatga
1472
+ aagaac
1473
+ cgacaa
1474
+ tccatc
1475
+ cccccg
1476
+ tgacgc
1477
+ ctgcag
1478
+ tgttcg
1479
+ cagaaa
1480
+ gccaac
1481
+ caaaac
1482
+ ggattt
1483
+ gaagtc
1484
+ aaagcg
1485
+ tcctga
1486
+ gtcgtg
1487
+ agagcg
1488
+ gaccac
1489
+ ggaccg
1490
+ tctcct
1491
+ caaaga
1492
+ acggtg
1493
+ cggtcc
1494
+ gacttc
1495
+ gaaggg
1496
+ gggaag
1497
+ cgtggt
1498
+ caagga
1499
+ gagcgt
1500
+ gggtgc
1501
+ gcgaca
1502
+ gtgatc
1503
+ tggaga
1504
+ cgacat
1505
+ ttcagg
1506
+ ggaaat
1507
+ aagccc
1508
+ caccgt
1509
+ gccaga
1510
+ caagcg
1511
+ ttttcg
1512
+ tcaaca
1513
+ tgccag
1514
+ tttcca
1515
+ gagatg
1516
+ gagccc
1517
+ tgaaat
1518
+ ctcggt
1519
+ gcaacg
1520
+ aagagc
1521
+ acatcg
1522
+ cggggg
1523
+ acggct
1524
+ cccacc
1525
+ ctggca
1526
+ agctga
1527
+ aaatct
1528
+ catcct
1529
+ cggaaa
1530
+ catcca
1531
+ tgttga
1532
+ ctcgct
1533
+ catctc
1534
+ aacgcg
1535
+ aaatcg
1536
+ gaagca
1537
+ gaagtt
1538
+ ttcaat
1539
+ tggatg
1540
+ agccgt
1541
+ agattt
1542
+ ttcttg
1543
+ ataaat
1544
+ taattt
1545
+ ggttga
1546
+ tctgcc
1547
+ caggac
1548
+ cgcaag
1549
+ ctcaag
1550
+ ctgaaa
1551
+ aaggag
1552
+ ccgcat
1553
+ catctt
1554
+ ttttgg
1555
+ tcaacc
1556
+ tcgaca
1557
+ cgctct
1558
+ atgtcg
1559
+ cgatgt
1560
+ aacttc
1561
+ gttggc
1562
+ gggctc
1563
+ gtggtc
1564
+ aagaat
1565
+ ggtggg
1566
+ gcgaaa
1567
+ tcaaag
1568
+ gagttc
1569
+ atcaag
1570
+ gccctt
1571
+ aaaggc
1572
+ cttgaa
1573
+ gcgtga
1574
+ tttatc
1575
+ cgcttg
1576
+ attgat
1577
+ tgtcgc
1578
+ ttgtcg
1579
+ ttcaag
1580
+ atcttt
1581
+ gaactc
1582
+ atgcgg
1583
+ gaactg
1584
+ cttccc
1585
+ gagacg
1586
+ tcacgc
1587
+ tccgca
1588
+ gggatg
1589
+ cttttg
1590
+ tttaat
1591
+ tctggc
1592
+ cgttgc
1593
+ atcaat
1594
+ cctcaa
1595
+ caaatt
1596
+ agggca
1597
+ tctcca
1598
+ tttcat
1599
+ tgtcga
1600
+ aatttg
1601
+ tttgct
1602
+ tgcttt
1603
+ ggaggt
1604
+ gggctt
1605
+ gagagc
1606
+ cgtctc
1607
+ cccgat
1608
+ gggcac
1609
+ cccttc
1610
+ tctgct
1611
+ agcgga
1612
+ ccgaaa
1613
+ gttttg
1614
+ cgcgtt
1615
+ aacctg
1616
+ catccc
1617
+ tcagct
1618
+ tgcgga
1619
+ cgagac
1620
+ atttat
1621
+ acgcca
1622
+ cgtcaa
1623
+ cgaagt
1624
+ gccaaa
1625
+ cggacc
1626
+ atttcc
1627
+ acctcc
1628
+ aaaagt
1629
+ ggtccg
1630
+ cttgag
1631
+ cttgcg
1632
+ atttca
1633
+ cagttc
1634
+ gagcaa
1635
+ gtcctg
1636
+ tgggca
1637
+ aattga
1638
+ aaggtg
1639
+ gctccc
1640
+ gtgccc
1641
+ tcaccc
1642
+ acttcg
1643
+ tgccca
1644
+ aactgc
1645
+ tcaggc
1646
+ gggtga
1647
+ gcctga
1648
+ aagcaa
1649
+ tccttg
1650
+ catttt
1651
+ cgcttt
1652
+ cgaacc
1653
+ gggagc
1654
+ cgattt
1655
+ aattgc
1656
+ ccaagc
1657
+ ccagat
1658
+ tcatct
1659
+ ttgagg
1660
+ aacatc
1661
+ gcaaga
1662
+ gaaccg
1663
+ gctctc
1664
+ atcggg
1665
+ agaaag
1666
+ aaggcc
1667
+ ctttgc
1668
+ aattaa
1669
+ aagatt
1670
+ gatcat
1671
+ tgcttc
1672
+ gtctcg
1673
+ caacga
1674
+ gttttc
1675
+ acagca
1676
+ caggtt
1677
+ atgatc
1678
+ tccaga
1679
+ gttctt
1680
+ ttcctt
1681
+ ttgacg
1682
+ atctgg
1683
+ gcagtt
1684
+ gctctt
1685
+ tgccaa
1686
+ gccccc
1687
+ gatgtt
1688
+ cggttc
1689
+ tttcct
1690
+ agcctg
1691
+ aacccg
1692
+ gcaatt
1693
+ cttgat
1694
+ cgtcag
1695
+ tccgct
1696
+ gacagc
1697
+ gaaata
1698
+ ggttcg
1699
+ caggct
1700
+ aggtga
1701
+ cgggac
1702
+ tttccg
1703
+ tcaaga
1704
+ ctgacg
1705
+ agcgac
1706
+ gatatt
1707
+ tctttg
1708
+ gtcccg
1709
+ aacaac
1710
+ tttctc
1711
+ ctttga
1712
+ gcttgg
1713
+ cgcaac
1714
+ tcccga
1715
+ agcgat
1716
+ caaatc
1717
+ tctgga
1718
+ ggcccc
1719
+ ctcctt
1720
+ aattta
1721
+ caccaa
1722
+ aattat
1723
+ tggcgt
1724
+ tttcag
1725
+ tttcgc
1726
+ tttctg
1727
+ aatatc
1728
+ gaacaa
1729
+ aaagtt
1730
+ ggaaag
1731
+ cacgct
1732
+ aaactt
1733
+ aggctg
1734
+ cgcaga
1735
+ atgacg
1736
+ gggcat
1737
+ atgccc
1738
+ tctttc
1739
+ accgct
1740
+ tgccct
1741
+ attctt
1742
+ ttggca
1743
+ agatgc
1744
+ agcaat
1745
+ agcgtg
1746
+ atcgct
1747
+ ggaacg
1748
+ ggtcaa
1749
+ gatttg
1750
+ aaccgg
1751
+ aagacg
1752
+ ttgctc
1753
+ aaccag
1754
+ gcaaat
1755
+ aaggca
1756
+ cgtcat
1757
+ gcaaca
1758
+ gggggc
1759
+ taaatt
1760
+ cacctt
1761
+ tgaaag
1762
+ caacgg
1763
+ aagttt
1764
+ gctgtc
1765
+ tgacca
1766
+ caccat
1767
+ caaccg
1768
+ atggtg
1769
+ ataatt
1770
+ tcaatt
1771
+ ggggcc
1772
+ gatcaa
1773
+ caagca
1774
+ tgcaaa
1775
+ atggcc
1776
+ aatctt
1777
+ agcggt
1778
+ aagatc
1779
+ cgttcc
1780
+ aaaccg
1781
+ accgca
1782
+ gttgcg
1783
+ cagcct
1784
+ tcggga
1785
+ gtcgct
1786
+ tcacct
1787
+ atcgaa
1788
+ tgcacc
1789
+ cgggtt
1790
+ agttcg
1791
+ ggccat
1792
+ cctttt
1793
+ cagatc
1794
+ ggtgca
1795
+ ttgacc
1796
+ aggcgt
1797
+ attgct
1798
+ gccttt
1799
+ tttggc
1800
+ aagcca
1801
+ tggtca
1802
+ aagctt
1803
+ gcaacc
1804
+ cgaact
1805
+ caggca
1806
+ tttcgg
1807
+ atgagc
1808
+ ggaggg
1809
+ tcttgc
1810
+ acgcga
1811
+ gtaaaa
1812
+ acgcct
1813
+ aactgg
1814
+ aacagg
1815
+ aaagga
1816
+ tcgttg
1817
+ gggagg
1818
+ gggaaa
1819
+ aaagag
1820
+ ggaatt
1821
+ ctcaac
1822
+ tgagga
1823
+ tgctgt
1824
+ gattga
1825
+ ttaatt
1826
+ ccctcc
1827
+ agaatt
1828
+ acagcg
1829
+ ggcatg
1830
+ tctgcg
1831
+ ggcctt
1832
+ agaccg
1833
+ tcttga
1834
+ cggttg
1835
+ ccggtt
1836
+ cacccc
1837
+ ggaagt
1838
+ gtggac
1839
+ gcatct
1840
+ gcatgg
1841
+ cctccc
1842
+ acaccg
1843
+ aacaat
1844
+ cacgat
1845
+ ctggtt
1846
+ aatgaa
1847
+ gtccac
1848
+ gttgtt
1849
+ catgcc
1850
+ agcccc
1851
+ tgatca
1852
+ gatctg
1853
+ aagacc
1854
+ ccgttg
1855
+ cgacac
1856
+ ttgctt
1857
+ cacgag
1858
+ gctcac
1859
+ ttggtg
1860
+ aaacca
1861
+ ggagag
1862
+ gcccca
1863
+ atttgc
1864
+ atcgtg
1865
+ ctcaaa
1866
+ ggggag
1867
+ ggttgc
1868
+ ccatgc
1869
+ gttgag
1870
+ gtgagc
1871
+ aaaacg
1872
+ tgttgc
1873
+ aattcc
1874
+ tgcttg
1875
+ tgcggt
1876
+ aactcg
1877
+ gctcat
1878
+ tatttc
1879
+ agacga
1880
+ taaaag
1881
+ ctcccc
1882
+ tcaatc
1883
+ tcctca
1884
+ ggatca
1885
+ caacct
1886
+ ttgttc
1887
+ ccaagg
1888
+ acgtgc
1889
+ tcaaat
1890
+ ccagtt
1891
+ cgagtt
1892
+ tgaacg
1893
+ aggaac
1894
+ aggttg
1895
+ ttgatc
1896
+ acatca
1897
+ attcaa
1898
+ acctga
1899
+ tgcctg
1900
+ gagaac
1901
+ aggccc
1902
+ ccatct
1903
+ cggaac
1904
+ atttga
1905
+ atcacg
1906
+ tggggc
1907
+ acttcc
1908
+ cagatg
1909
+ aattct
1910
+ cgtctt
1911
+ taaaga
1912
+ ggggtg
1913
+ tttgca
1914
+ tcgcgt
1915
+ gctcag
1916
+ accgga
1917
+ gtggaa
1918
+ gatctt
1919
+ cggttt
1920
+ agatgg
1921
+ caatca
1922
+ cgctgt
1923
+ ctctcc
1924
+ agagca
1925
+ gcacgt
1926
+ tgatcc
1927
+ ataaag
1928
+ atttaa
1929
+ ccaacc
1930
+ gaacga
1931
+ ttggaa
1932
+ ttcgat
1933
+ gcaatc
1934
+ acggtc
1935
+ ggggct
1936
+ gggcca
1937
+ ctcgtg
1938
+ cgttca
1939
+ attgtt
1940
+ agcaag
1941
+ cggtgt
1942
+ agacgc
1943
+ agaagt
1944
+ aatcgc
1945
+ gctgag
1946
+ aacacc
1947
+ ctcagc
1948
+ agggcc
1949
+ gaccgt
1950
+ actttt
1951
+ gttccg
1952
+ aaacag
1953
+ aagagg
1954
+ tggctt
1955
+ ccgtga
1956
+ gtgtcg
1957
+ gattgc
1958
+ cgtgat
1959
+ ctgagc
1960
+ atgctc
1961
+ ccaaag
1962
+ tcacgg
1963
+ tgcctt
1964
+ ggacgt
1965
+ acgtcc
1966
+ cgcaaa
1967
+ ttgaat
1968
+ cggtct
1969
+ aacttt
1970
+ agcaac
1971
+ acttca
1972
+ gagcat
1973
+ aggcag
1974
+ cctgtt
1975
+ tggccc
1976
+ atgacc
1977
+ caaggt
1978
+ gttcaa
1979
+ tgatgt
1980
+ tacggc
1981
+ cgtgca
1982
+ tgaagt
1983
+ gcgatt
1984
+ ctttct
1985
+ aagtcg
1986
+ ttaaat
1987
+ tgattg
1988
+ aattca
1989
+ tccggt
1990
+ aaggtc
1991
+ gggcct
1992
+ cacggg
1993
+ atgggc
1994
+ cgacag
1995
+ acagcc
1996
+ tttgag
1997
+ atggca
1998
+ cccacg
1999
+ ccttgg
2000
+ aatgcc
2001
+ catctg
2002
+ cccatc
2003
+ aggcaa
2004
+ gtcagg
2005
+ tgcacg
2006
+ caacag
2007
+ aaggct
2008
+ tgaatt
2009
+ ggtcat
2010
+ caagat
2011
+ tcaggt
2012
+ ggttgg
2013
+ caaagg
2014
+ tcgtct
2015
+ atgaac
2016
+ cctgac
2017
+ caacca
2018
+ ttccaa
2019
+ taataa
2020
+ agatca
2021
+ agacgg
2022
+ gatggg
2023
+ actggc
2024
+ cccgtg
2025
+ cgaaat
2026
+ gcgtct
2027
+ gccgta
2028
+ tggttt
2029
+ tcgttc
2030
+ ggccct
2031
+ ctttcc
2032
+ aacaag
2033
+ caaccc
2034
+ tatcaa
2035
+ gttcct
2036
+ gttctc
2037
+ ggtctt
2038
+ aggatc
2039
+ gccagt
2040
+ gatccc
2041
+ ttgaac
2042
+ agccaa
2043
+ cgactt
2044
+ tcgaaa
2045
+ ttccac
2046
+ ttatta
2047
+ gggaga
2048
+ tgaaca
2049
+ gcccat
2050
+ ccaacg
2051
+ tccaaa
2052
+ ggcatt
2053
+ gtcaac
2054
+ gaattg
2055
+ ctttca
2056
+ accttg
2057
+ caaggg
2058
+ aagcga
2059
+ cgtggg
2060
+ ggggca
2061
+ atggaa
2062
+ tgcccc
2063
+ ttgata
2064
+ tttccc
2065
+ aagttc
2066
+ ctgtcg
2067
+ gggatc
2068
+ ctccga
2069
+ acttct
2070
+ tgccat
2071
+ ggctca
2072
+ caactg
2073
+ ggaaca
2074
+ caaacc
2075
+ attaat
2076
+ cagttg
2077
+ ggtgtt
2078
+ tataaa
2079
+ tccgga
2080
+ ttttac
2081
+ ttgcaa
2082
+ taaata
2083
+ gttgct
2084
+ cgagag
2085
+ accgtg
2086
+ ctgaac
2087
+ gaatat
2088
+ ggtaaa
2089
+ tggttg
2090
+ cacggt
2091
+ gaaacc
2092
+ aagcct
2093
+ acgaac
2094
+ ttcatt
2095
+ aaatga
2096
+ accaaa
2097
+ gttgac
2098
+ aatcag
2099
+ tgctct
2100
+ gaactt
2101
+ ggctgt
2102
+ gatcct
2103
+ aatggc
2104
+ cttgct
2105
+ tcaaac
2106
+ gggttg
2107
+ ccccag
2108
+ tgcaga
2109
+ ctgttg
2110
+ atattg
2111
+ tcggag
2112
+ aaatac
2113
+ ctgcct
2114
+ tccttt
2115
+ gttcag
2116
+ agcctt
2117
+ agttga
2118
+ ctctcg
2119
+ atttcg
2120
+ ccgtct
2121
+ ctgggg
2122
+ atcttg
2123
+ gttcat
2124
+ ctcttt
2125
+ atgcag
2126
+ agaaca
2127
+ tgagcc
2128
+ tctccc
2129
+ cgtgaa
2130
+ aggctt
2131
+ tttgcg
2132
+ tgttca
2133
+ gagcca
2134
+ agagga
2135
+ gacacc
2136
+ caggta
2137
+ caataa
2138
+ tattta
2139
+ gacgga
2140
+ ctgttt
2141
+ ggctac
2142
+ gcaaac
2143
+ tcgcag
2144
+ aactcc
2145
+ cgaaag
2146
+ tgataa
2147
+ aaagac
2148
+ agcagt
2149
+ caatat
2150
+ gacaag
2151
+ ctttgg
2152
+ gacctt
2153
+ aaactg
2154
+ ggggaa
2155
+ caatcc
2156
+ gtttga
2157
+ aagttg
2158
+ tggcca
2159
+ accaga
2160
+ ctttta
2161
+ ctgcga
2162
+ caattc
2163
+ ggtcac
2164
+ atattc
2165
+ ggattg
2166
+ ggtttg
2167
+ cccttg
2168
+ gacaaa
2169
+ cagaac
2170
+ ccatga
2171
+ accaac
2172
+ cgttgg
2173
+ tttgga
2174
+ gccaat
2175
+ gtgacc
2176
+ tggaac
2177
+ gagggg
2178
+ atggag
2179
+ cctctt
2180
+ agaacg
2181
+ gcagac
2182
+ gaaatg
2183
+ cgtttt
2184
+ acaagc
2185
+ ctttat
2186
+ aaatgc
2187
+ aggggc
2188
+ cccctc
2189
+ agagaa
2190
+ gataat
2191
+ ggagtt
2192
+ gttcgt
2193
+ ttgcct
2194
+ gccatt
2195
+ cgtgac
2196
+ ggaact
2197
+ ttattg
2198
+ gtcacg
2199
+ ggtttc
2200
+ tgatct
2201
+ tcatgg
2202
+ aaacgc
2203
+ ctgatt
2204
+ tcgctt
2205
+ gcaatg
2206
+ ggggat
2207
+ gcccct
2208
+ aggtca
2209
+ tggctc
2210
+ actgct
2211
+ ttggct
2212
+ aaatgg
2213
+ tctgca
2214
+ tcttta
2215
+ tcaact
2216
+ tgttcc
2217
+ attggc
2218
+ cttgtt
2219
+ aaacct
2220
+ ttcacg
2221
+ gtagcc
2222
+ agttcc
2223
+ atcccc
2224
+ cctttg
2225
+ agataa
2226
+ gcccaa
2227
+ ggccca
2228
+ tacctg
2229
+ catgaa
2230
+ caccca
2231
+ gttcca
2232
+ ccaaca
2233
+ cacgaa
2234
+ gaagtg
2235
+ tttata
2236
+ acccga
2237
+ aagaga
2238
+ aaccaa
2239
+ tattga
2240
+ tttcga
2241
+ ctaaaa
2242
+ gcaact
2243
+ ggtgtc
2244
+ caaaca
2245
+ ttatca
2246
+ aagata
2247
+ aacgac
2248
+ aggaat
2249
+ agttgc
2250
+ taaaac
2251
+ tccgtc
2252
+ agctca
2253
+ tagaaa
2254
+ attatc
2255
+ ggagac
2256
+ aaactc
2257
+ caactc
2258
+ ctccat
2259
+ agaaac
2260
+ tccgac
2261
+ ctgcat
2262
+ cattgc
2263
+ caactt
2264
+ gaagta
2265
+ tacgcc
2266
+ ttaaag
2267
+ gtttgc
2268
+ acgtgg
2269
+ acatcc
2270
+ ttcccc
2271
+ cagagc
2272
+ aggatt
2273
+ ggcgta
2274
+ ttccat
2275
+ ccacgt
2276
+ gcggta
2277
+ gagttg
2278
+ gacccc
2279
+ tgggcc
2280
+ ataata
2281
+ gttctg
2282
+ gtctgc
2283
+ cccaaa
2284
+ taccgc
2285
+ aaggat
2286
+ gtcgga
2287
+ gaaagg
2288
+ cagttt
2289
+ gttggt
2290
+ aatccg
2291
+ tcaata
2292
+ caattg
2293
+ agcgaa
2294
+ tgggtg
2295
+ aggttt
2296
+ atcgat
2297
+ tttacc
2298
+ gcttgt
2299
+ caacat
2300
+ ggatgt
2301
+ gtctcc
2302
+ acaaat
2303
+ tctggt
2304
+ tgacct
2305
+ caatgc
2306
+ ggttca
2307
+ gattat
2308
+ aacctc
2309
+ atgttg
2310
+ caaata
2311
+ tcattt
2312
+ gtattt
2313
+ acaaag
2314
+ gagatt
2315
+ cacttc
2316
+ agcctc
2317
+ aatcct
2318
+ tgttgg
2319
+ cttgtc
2320
+ tttggt
2321
+ cccaga
2322
+ ctggga
2323
+ acaaca
2324
+ tgagct
2325
+ cgttct
2326
+ gaggct
2327
+ tgaacc
2328
+ tttgtc
2329
+ acgaga
2330
+ actgcc
2331
+ gcattt
2332
+ aatcca
2333
+ atgatt
2334
+ agaacc
2335
+ cagggt
2336
+ tgttct
2337
+ gcattg
2338
+ gctctg
2339
+ aatgat
2340
+ aggcca
2341
+ ggcagt
2342
+ gaaccc
2343
+ cggaca
2344
+ gatgca
2345
+ aatata
2346
+ ttcatg
2347
+ ttgggc
2348
+ gaggtt
2349
+ gagttt
2350
+ tattat
2351
+ ggaaac
2352
+ gtcaaa
2353
+ aaaggt
2354
+ tcctct
2355
+ tgtttg
2356
+ gcgttt
2357
+ gcgagt
2358
+ aaggac
2359
+ aatcat
2360
+ ggggtc
2361
+ acaagg
2362
+ attcct
2363
+ catttc
2364
+ aacgtc
2365
+ accctg
2366
+ actcgc
2367
+ gattta
2368
+ cggatt
2369
+ caatcg
2370
+ ttcgtg
2371
+ ctttcg
2372
+ tcgggt
2373
+ gaaaca
2374
+ tacttc
2375
+ aatctc
2376
+ tcaggg
2377
+ atcatg
2378
+ atggct
2379
+ taaagc
2380
+ gaacac
2381
+ ccctga
2382
+ aacgag
2383
+ ataatc
2384
+ cgattg
2385
+ cattga
2386
+ catgat
2387
+ aaatag
2388
+ atttgt
2389
+ gtttta
2390
+ cggcta
2391
+ tgaaac
2392
+ gggttc
2393
+ agccat
2394
+ cagacc
2395
+ gagacc
2396
+ acccag
2397
+ ctacga
2398
+ ccccgt
2399
+ tctggg
2400
+ aatcgg
2401
+ agggct
2402
+ tcccag
2403
+ tatttg
2404
+ agttca
2405
+ tggatt
2406
+ agtcgc
2407
+ gcagag
2408
+ ccaatc
2409
+ ccagag
2410
+ ttggtt
2411
+ gattgg
2412
+ acaggc
2413
+ aggtcc
2414
+ gtcgtt
2415
+ agagcc
2416
+ aggctc
2417
+ acgggg
2418
+ ctcgga
2419
+ gcgact
2420
+ agccct
2421
+ gcatga
2422
+ tcacga
2423
+ tccgag
2424
+ aaaccc
2425
+ tcaatg
2426
+ tacaaa
2427
+ ccagac
2428
+ atcatt
2429
+ gtttct
2430
+ aatcga
2431
+ tgtccg
2432
+ cagggg
2433
+ ggttct
2434
+ gaacat
2435
+ tgcatc
2436
+ agtcgg
2437
+ ccaaat
2438
+ tagccg
2439
+ ccattt
2440
+ taaatc
2441
+ tgggaa
2442
+ tgaact
2443
+ tcgtga
2444
+ gaacca
2445
+ caaact
2446
+ gaaacg
2447
+ agattg
2448
+ cagacg
2449
+ ctccaa
2450
+ cgaaac
2451
+ gaccat
2452
+ gatcca
2453
+ aattgg
2454
+ ccgact
2455
+ atggtc
2456
+ gcttta
2457
+ tttggg
2458
+ ctttaa
2459
+ ccgatt
2460
+ ggacct
2461
+ ttttag
2462
+ gagcct
2463
+ tcatgc
2464
+ ttggag
2465
+ ctgggt
2466
+ ggccaa
2467
+ atttgg
2468
+ ggacaa
2469
+ gtggat
2470
+ gcctca
2471
+ gacgtt
2472
+ tattaa
2473
+ ttcgct
2474
+ gactgg
2475
+ ttatct
2476
+ tttcta
2477
+ aaggtt
2478
+ tatatt
2479
+ gtcaag
2480
+ tctcgt
2481
+ atcctt
2482
+ cagatt
2483
+ gacaac
2484
+ ttctct
2485
+ cgctac
2486
+ ggtctg
2487
+ tgaggc
2488
+ agatcc
2489
+ agaact
2490
+ aatctg
2491
+ gtttcc
2492
+ atccac
2493
+ atcgca
2494
+ gtgttc
2495
+ aaacgg
2496
+ acgcag
2497
+ aaagta
2498
+ tgttgt
2499
+ ccaatt
2500
+ aggacc
2501
+ ggtctc
2502
+ tggttc
2503
+ tttgac
2504
+ tatctt
2505
+ agtttg
2506
+ atgttc
2507
+ taccag
2508
+ acaatt
2509
+ ctctgc
2510
+ acaacc
2511
+ aatgct
2512
+ ggctct
2513
+ tagaag
2514
+ aattgt
2515
+ ctttgt
2516
+ cccctg
2517
+ ctcgtt
2518
+ caatgg
2519
+ acagct
2520
+ tcgtag
2521
+ tggatc
2522
+ tggcct
2523
+ gtctgg
2524
+ gtttca
2525
+ ccagtc
2526
+ ctctgg
2527
+ gtagcg
2528
+ tctctt
2529
+ cgtctg
2530
+ tggaat
2531
+ gcctgt
2532
+ ttaata
2533
+ tcagaa
2534
+ ccttgt
2535
+ caatct
2536
+ gtcttt
2537
+ ttgaga
2538
+ ctggta
2539
+ atgaat
2540
+ gaacct
2541
+ tcgatt
2542
+ gtagaa
2543
+ acagga
2544
+ gagagg
2545
+ tttgta
2546
+ tgcgat
2547
+ agccca
2548
+ caacac
2549
+ cttgac
2550
+ acgaaa
2551
+ agctgt
2552
+ acacca
2553
+ atgcca
2554
+ aggttc
2555
+ gggttt
2556
+ cctttc
2557
+ gaatcg
2558
+ gtttcg
2559
+ cgtttc
2560
+ agccac
2561
+ tgtttc
2562
+ ccatgg
2563
+ gaattc
2564
+ agggtg
2565
+ gagaat
2566
+ ccattg
2567
+ attcca
2568
+ ggtcca
2569
+ gtgaac
2570
+ ccaaac
2571
+ gtggca
2572
+ agaggc
2573
+ gaaact
2574
+ ccaaga
2575
+ caggga
2576
+ tctcaa
2577
+ ttccca
2578
+ agcatt
2579
+ tgagaa
2580
+ aacctt
2581
+ ggatct
2582
+ ccccac
2583
+ cgattc
2584
+ actgga
2585
+ cagtcg
2586
+ cctctc
2587
+ gttcac
2588
+ tggacc
2589
+ cgactg
2590
+ cgactc
2591
+ accgaa
2592
+ gcaata
2593
+ gctacg
2594
+ gggccc
2595
+ accaat
2596
+ acgaca
2597
+ ctgcgt
2598
+ atatta
2599
+ gtgaaa
2600
+ caatga
2601
+ agttct
2602
+ attgag
2603
+ ggtcct
2604
+ cataaa
2605
+ caccct
2606
+ tgccac
2607
+ accaag
2608
+ gagtcg
2609
+ aatccc
2610
+ gttgtc
2611
+ gtagag
2612
+ gggaat
2613
+ aacttg
2614
+ ttctac
2615
+ ctacaa
2616
+ gaaagt
2617
+ catgga
2618
+ gaccaa
2619
+ tgcaag
2620
+ gtggct
2621
+ tggcat
2622
+ accttt
2623
+ accgat
2624
+ agttgg
2625
+ ttggcc
2626
+ gggatt
2627
+ gtgagg
2628
+ ggttgt
2629
+ caagtt
2630
+ caatta
2631
+ agatat
2632
+ tcccca
2633
+ tctacg
2634
+ cctcac
2635
+ attcat
2636
+ ggtaga
2637
+ tgggga
2638
+ gaatta
2639
+ ctctac
2640
+ ccgttt
2641
+ gtgttg
2642
+ acctca
2643
+ caagac
2644
+ ctattt
2645
+ attggt
2646
+ tattgc
2647
+ atcggt
2648
+ gggaac
2649
+ acaacg
2650
+ agggaa
2651
+ gcgaat
2652
+ tgggct
2653
+ ccaact
2654
+ cgcatg
2655
+ aaacat
2656
+ cgtagc
2657
+ aggtag
2658
+ ggatat
2659
+ gacagg
2660
+ ttgtcc
2661
+ ttctga
2662
+ ggaacc
2663
+ caaagt
2664
+ ctcaat
2665
+ tgaccc
2666
+ cttcta
2667
+ cacagc
2668
+ catgcg
2669
+ attgca
2670
+ tgggag
2671
+ cggaat
2672
+ cgtaga
2673
+ gaatgg
2674
+ attccc
2675
+ atccaa
2676
+ gtcctt
2677
+ agtttc
2678
+ gtgggg
2679
+ attctc
2680
+ aacgaa
2681
+ cccaac
2682
+ gggtca
2683
+ agtaaa
2684
+ attccg
2685
+ attcgc
2686
+ gaacgt
2687
+ agtcga
2688
+ gcctct
2689
+ acaaga
2690
+ aaacga
2691
+ taatat
2692
+ tggtgt
2693
+ taattg
2694
+ gtttgg
2695
+ cgataa
2696
+ ttggga
2697
+ gttccc
2698
+ atgagg
2699
+ cttgca
2700
+ ttataa
2701
+ ttgtag
2702
+ agagct
2703
+ aatgga
2704
+ gctacc
2705
+ aacggg
2706
+ tcggaa
2707
+ tcccaa
2708
+ tctacc
2709
+ cgaatt
2710
+ tgaggt
2711
+ gatatc
2712
+ ccccaa
2713
+ ggaatg
2714
+ gttgga
2715
+ aattcg
2716
+ tccagt
2717
+ caagag
2718
+ ctccca
2719
+ ataaac
2720
+ ggttcc
2721
+ tcattg
2722
+ ctacct
2723
+ tccctg
2724
+ tgcaat
2725
+ tccaac
2726
+ tcctgt
2727
+ tccatg
2728
+ ggacag
2729
+ tcggac
2730
+ gtccga
2731
+ ggtagc
2732
+ tcgact
2733
+ ttctca
2734
+ atataa
2735
+ cttggt
2736
+ tcatga
2737
+ acgttc
2738
+ agacca
2739
+ atagaa
2740
+ gttggg
2741
+ aattac
2742
+ cccgtt
2743
+ agctct
2744
+ gaggca
2745
+ cagaat
2746
+ agaata
2747
+ ttggtc
2748
+ gaataa
2749
+ ttatcg
2750
+ cctgtc
2751
+ ggggga
2752
+ ttacaa
2753
+ gacgca
2754
+ ttcggt
2755
+ tgtaaa
2756
+ tcttgg
2757
+ gtaaag
2758
+ gtaaat
2759
+ attgac
2760
+ tttatg
2761
+ ttggat
2762
+ ttccga
2763
+ aggagt
2764
+ aaccga
2765
+ agggga
2766
+ ctcagg
2767
+ cctgag
2768
+ taccgg
2769
+ atatct
2770
+ taattc
2771
+ ccggta
2772
+ cctcat
2773
+ atgttt
2774
+ atatcc
2775
+ tgtcgt
2776
+ gatgtg
2777
+ attctg
2778
+ atatat
2779
+ gttgca
2780
+ ccacaa
2781
+ atttac
2782
+ cccaag
2783
+ tttcgt
2784
+ gctgtg
2785
+ aaagtc
2786
+ aactga
2787
+ cattcc
2788
+ gtcttg
2789
+ gtttat
2790
+ acaggt
2791
+ aatacc
2792
+ cgttgt
2793
+ accggt
2794
+ ccattc
2795
+ tgcaac
2796
+ cacatc
2797
+ aagcat
2798
+ agcatg
2799
+ ttgtaa
2800
+ caacgt
2801
+ ttgggg
2802
+ ggaata
2803
+ ctgtcc
2804
+ gacacg
2805
+ ggaatc
2806
+ ttcaga
2807
+ aacgct
2808
+ tccccc
2809
+ tctgaa
2810
+ gcctac
2811
+ acaatc
2812
+ catgct
2813
+ acaaac
2814
+ gtcaat
2815
+ actttg
2816
+ ggtatt
2817
+ ggataa
2818
+ gattcc
2819
+ aagggg
2820
+ tatgaa
2821
+ tgcgtc
2822
+ ggggac
2823
+ atgctt
2824
+ gtaatt
2825
+ tccgaa
2826
+ aacccc
2827
+ tttcac
2828
+ tgaata
2829
+ agagat
2830
+ tggaca
2831
+ gaatca
2832
+ tgcctc
2833
+ attcag
2834
+ agatgt
2835
+ actcct
2836
+ aaaggg
2837
+ aagtaa
2838
+ attacc
2839
+ gtcccc
2840
+ ggtaat
2841
+ acacgc
2842
+ ccgagt
2843
+ gtaggc
2844
+ aggaca
2845
+ acctgt
2846
+ ctaccg
2847
+ ttgtgg
2848
+ acgttg
2849
+ aacgat
2850
+ ttattc
2851
+ gcaagt
2852
+ tattca
2853
+ cacaaa
2854
+ actggt
2855
+ actcgg
2856
+ ctcttg
2857
+ cttggg
2858
+ aatgtt
2859
+ accagt
2860
+ taaagg
2861
+ gccaca
2862
+ atatca
2863
+ gcacaa
2864
+ tggtaa
2865
+ aagcac
2866
+ ttatat
2867
+ gattgt
2868
+ aacatt
2869
+ ctgaat
2870
+ cggtag
2871
+ cgaatc
2872
+ tgatat
2873
+ agcgtt
2874
+ attgcg
2875
+ tcagtt
2876
+ cgcaat
2877
+ ggacca
2878
+ tttaca
2879
+ tcttgt
2880
+ cgagtc
2881
+ aatggt
2882
+ ttccct
2883
+ caaacg
2884
+ tacttt
2885
+ ttcgga
2886
+ aacaga
2887
+ tattcc
2888
+ atggat
2889
+ aatcgt
2890
+ tccatt
2891
+ tgattc
2892
+ ttcgtt
2893
+ acgatt
2894
+ agacct
2895
+ accatg
2896
+ cgtgtc
2897
+ catgac
2898
+ gattcg
2899
+ gactcg
2900
+ acttgc
2901
+ ctacgc
2902
+ agaatc
2903
+ tttact
2904
+ tcggtt
2905
+ tggtct
2906
+ tgtgga
2907
+ tcgcaa
2908
+ tcgttt
2909
+ taatta
2910
+ aggtaa
2911
+ aatatg
2912
+ actgcg
2913
+ actccg
2914
+ gctaaa
2915
+ atggac
2916
+ gtcatg
2917
+ atcgtt
2918
+ aaggga
2919
+ acatct
2920
+ ggggtt
2921
+ tgtggc
2922
+ aactca
2923
+ cagata
2924
+ aagtgg
2925
+ agaggt
2926
+ catggt
2927
+ gcgtag
2928
+ gcgtgt
2929
+ tccaca
2930
+ acagaa
2931
+ tcccct
2932
+ gtgcca
2933
+ attgga
2934
+ cccctt
2935
+ caaatg
2936
+ tggcac
2937
+ actcga
2938
+ ggacat
2939
+ tgtcca
2940
+ gagata
2941
+ acggga
2942
+ aggtct
2943
+ cgcagt
2944
+ ccaatg
2945
+ gcatgc
2946
+ gcagtg
2947
+ gtttgt
2948
+ tacagc
2949
+ ctacgg
2950
+ ttgcga
2951
+ acggag
2952
+ gatgta
2953
+ cggagt
2954
+ ttacca
2955
+ gttaaa
2956
+ ctcgca
2957
+ tgacaa
2958
+ cactgc
2959
+ tattct
2960
+ gattct
2961
+ atccat
2962
+ aagtcc
2963
+ ggactt
2964
+ gagggt
2965
+ ctttac
2966
+ aataga
2967
+ tgcgag
2968
+ aatact
2969
+ tgaggg
2970
+ catggg
2971
+ ccacag
2972
+ aggcat
2973
+ accctc
2974
+ atctct
2975
+ tacgac
2976
+ gaatgc
2977
+ aaccac
2978
+ gattca
2979
+ ccctca
2980
+ gtgctt
2981
+ tcgagt
2982
+ acaact
2983
+ gctgta
2984
+ gacttt
2985
+ tggtcc
2986
+ gtccat
2987
+ agtatt
2988
+ ccgtag
2989
+ tcccgt
2990
+ cggtaa
2991
+ cattgg
2992
+ cgtttg
2993
+ tacatc
2994
+ cgtgag
2995
+ acctct
2996
+ ttatcc
2997
+ accatt
2998
+ tatctg
2999
+ tgtaga
3000
+ actttc
3001
+ tgagtt
3002
+ tgaatc
3003
+ atgtcc
3004
+ agtggc
3005
+ gacaat
3006
+ ttctat
3007
+ gcagtc
3008
+ cagagg
3009
+ ttgtgc
3010
+ ccaata
3011
+ tattgg
3012
+ catatt
3013
+ gactgc
3014
+ ctcacg
3015
+ agttgt
3016
+ ttgtca
3017
+ ctccgt
3018
+ ttcata
3019
+ cccatg
3020
+ taccaa
3021
+ aagcgt
3022
+ gagtgg
3023
+ gcattc
3024
+ agggag
3025
+ aataac
3026
+ atatcg
3027
+ tccaat
3028
+ gtgcga
3029
+ taatca
3030
+ tggata
3031
+ tcgcac
3032
+ gtcgca
3033
+ cgatat
3034
+ aataca
3035
+ attata
3036
+ tttgtg
3037
+ tgcgac
3038
+ catttg
3039
+ tgatta
3040
+ ctacca
3041
+ ccgaat
3042
+ tctaca
3043
+ gtggtt
3044
+ aagtgc
3045
+ atgcct
3046
+ ctgtgg
3047
+ attcgg
3048
+ tggtag
3049
+ ccccca
3050
+ ttaccg
3051
+ atggtt
3052
+ acacct
3053
+ ttacct
3054
+ gcgata
3055
+ tgtcct
3056
+ tccaag
3057
+ ttactt
3058
+ tctgtt
3059
+ aaagtg
3060
+ cttgga
3061
+ gccact
3062
+ tgggat
3063
+ aaatgt
3064
+ cagtgg
3065
+ attgtc
3066
+ ccttta
3067
+ agagtt
3068
+ cacgca
3069
+ aggtgt
3070
+ agattc
3071
+ gattaa
3072
+ aagaca
3073
+ ttatga
3074
+ ttagaa
3075
+ aaccat
3076
+ tttaga
3077
+ acgctt
3078
+ ttggta
3079
+ atccca
3080
+ tctaaa
3081
+ tatcgc
3082
+ cacacc
3083
+ ccactt
3084
+ gttatt
3085
+ ggcaca
3086
+ ccactc
3087
+ tataat
3088
+ ctgagg
3089
+ cccttt
3090
+ ccactg
3091
+ attggg
3092
+ gtcgta
3093
+ aacacg
3094
+ gaatcc
3095
+ acaccc
3096
+ ggctat
3097
+ cccaat
3098
+ cttaaa
3099
+ atagcc
3100
+ gaatga
3101
+ gaggga
3102
+ gtagat
3103
+ tgaatg
3104
+ tttagc
3105
+ tacaac
3106
+ tcataa
3107
+ gaatct
3108
+ tttaac
3109
+ cctcag
3110
+ tatcca
3111
+ ggattc
3112
+ tatcga
3113
+ aatagc
3114
+ tatctc
3115
+ ctgata
3116
+ acggaa
3117
+ tatcag
3118
+ tggggg
3119
+ cacgga
3120
+ ggtgtg
3121
+ atctac
3122
+ actcca
3123
+ aggata
3124
+ aactct
3125
+ atcaga
3126
+ gcactt
3127
+ cctctg
3128
+ acatgg
3129
+ actggg
3130
+ tgcgtg
3131
+ gcacag
3132
+ tccctt
3133
+ ctccct
3134
+ ataatg
3135
+ actcaa
3136
+ gacatg
3137
+ aagtat
3138
+ acttga
3139
+ acgtca
3140
+ ttctgt
3141
+ tggagt
3142
+ tcgata
3143
+ gaggta
3144
+ gtggga
3145
+ cattca
3146
+ cagtgc
3147
+ agatag
3148
+ gggtgt
3149
+ agaatg
3150
+ taagaa
3151
+ gctatt
3152
+ gattac
3153
+ aatcac
3154
+ acccgt
3155
+ acattt
3156
+ gcactg
3157
+ tgtatt
3158
+ acgggt
3159
+ ttaatc
3160
+ ggatcc
3161
+ tgtgcc
3162
+ aatgcg
3163
+ tcaagt
3164
+ gttgta
3165
+ agtaat
3166
+ tttaag
3167
+ aaccca
3168
+ agacaa
3169
+ tctatt
3170
+ ttgaca
3171
+ cattaa
3172
+ tccgtg
3173
+ cccagt
3174
+ taatga
3175
+ cgcgta
3176
+ aagtag
3177
+ tacctc
3178
+ tcattc
3179
+ gcgtac
3180
+ agatta
3181
+ tacccg
3182
+ ttctaa
3183
+ ccgcta
3184
+ accccc
3185
+ aacggt
3186
+ tgagat
3187
+ cactgg
3188
+ ccagtg
3189
+ gatagc
3190
+ ccagta
3191
+ aataag
3192
+ gtacgc
3193
+ caatac
3194
+ actgca
3195
+ cgtgtt
3196
+ tgtcaa
3197
+ ccgata
3198
+ tacgcg
3199
+ cgcaca
3200
+ tactgg
3201
+ tagcgg
3202
+ cgccta
3203
+ catgtc
3204
+ tgcgaa
3205
+ cgggta
3206
+ acccca
3207
+ agtgga
3208
+ gcagta
3209
+ gtgatt
3210
+ gtattg
3211
+ acaata
3212
+ atctga
3213
+ cctacg
3214
+ attact
3215
+ actgaa
3216
+ cattat
3217
+ atcgga
3218
+ atccga
3219
+ caagtc
3220
+ ttaatg
3221
+ agaggg
3222
+ taacaa
3223
+ ggatta
3224
+ tctgat
3225
+ acccaa
3226
+ aagtca
3227
+ attaca
3228
+ gctatc
3229
+ taggcg
3230
+ tcagat
3231
+ atactt
3232
+ gacttg
3233
+ tccctc
3234
+ atgcaa
3235
+ tatcgg
3236
+ acacgg
3237
+ cgcatt
3238
+ gataga
3239
+ gggtcc
3240
+ agtccg
3241
+ ctgtgc
3242
+ ttgagt
3243
+ ccatgt
3244
+ atctca
3245
+ gggacc
3246
+ gtaatc
3247
+ taaagt
3248
+ atgtgg
3249
+ tgggtt
3250
+ attatg
3251
+ ggaccc
3252
+ ttccgt
3253
+ cggact
3254
+ tactgc
3255
+ tcccac
3256
+ atacaa
3257
+ gataag
3258
+ ttcgca
3259
+ tgacgt
3260
+ ggactg
3261
+ tgtgcg
3262
+ cagcta
3263
+ agtgcc
3264
+ gagaga
3265
+ gaatac
3266
+ gggggt
3267
+ atgata
3268
+ accgtt
3269
+ aacgtg
3270
+ ggtccc
3271
+ tgcagt
3272
+ ttgtta
3273
+ cgtagg
3274
+ acggac
3275
+ cagtcc
3276
+ tattgt
3277
+ taaaca
3278
+ aagagt
3279
+ ggcact
3280
+ tccgat
3281
+ atgggg
3282
+ tgtctt
3283
+ aatgca
3284
+ tggggt
3285
+ tagctg
3286
+ aggggg
3287
+ cacttt
3288
+ aggcct
3289
+ cattct
3290
+ tcatta
3291
+ acccac
3292
+ ccccat
3293
+ ttctta
3294
+ ccacat
3295
+ aaccgt
3296
+ tatcct
3297
+ cttatt
3298
+ taatcc
3299
+ aaggta
3300
+ tgtaat
3301
+ aaacta
3302
+ aaacac
3303
+ ccgtgt
3304
+ ataagc
3305
+ tcggat
3306
+ ttgggt
3307
+ taaacc
3308
+ tagagc
3309
+ tacgag
3310
+ ggagtg
3311
+ gctaca
3312
+ agggtt
3313
+ ctactt
3314
+ acggtt
3315
+ gtattc
3316
+ aatgac
3317
+ gtgggt
3318
+ cgtaaa
3319
+ aaccct
3320
+ gcttat
3321
+ cacgtt
3322
+ ctatct
3323
+ tacaag
3324
+ actgat
3325
+ cactcc
3326
+ cataat
3327
+ tgactt
3328
+ ccccct
3329
+ gctcta
3330
+ cacagg
3331
+ ggttta
3332
+ gtccgt
3333
+ ccctct
3334
+ aatggg
3335
+ cccaca
3336
+ atacca
3337
+ accaca
3338
+ ttcagt
3339
+ agcaca
3340
+ tagatg
3341
+ ctcgta
3342
+ taaatg
3343
+ tccact
3344
+ ttgcat
3345
+ cagaga
3346
+ gactcc
3347
+ agaccc
3348
+ cacaac
3349
+ atcagt
3350
+ gtaccg
3351
+ ggagtc
3352
+ cggtac
3353
+ acaatg
3354
+ tgtggg
3355
+ tgttta
3356
+ aagtta
3357
+ aattag
3358
+ taatct
3359
+ aagggt
3360
+ agatct
3361
+ tgtagc
3362
+ tacacc
3363
+ atagat
3364
+ ttgtat
3365
+ cttatc
3366
+ ggttat
3367
+ aactac
3368
+ ttgtct
3369
+ cgatta
3370
+ actctt
3371
+ tctctc
3372
+ acttta
3373
+ attcga
3374
+ tatcat
3375
+ tggtat
3376
+ agttta
3377
+ tctatc
3378
+ agtaga
3379
+ cgtacc
3380
+ ggtagg
3381
+ ggtgta
3382
+ ttaaac
3383
+ tgcatt
3384
+ ataacc
3385
+ aagcta
3386
+ aagtga
3387
+ tgtggt
3388
+ aggcac
3389
+ aacagt
3390
+ catcta
3391
+ cattta
3392
+ cttgta
3393
+ agggat
3394
+ tcgaat
3395
+ gcgcta
3396
+ gagtac
3397
+ gggagt
3398
+ tagagg
3399
+ gtgcac
3400
+ ggtacg
3401
+ cctacc
3402
+ taaact
3403
+ aacgga
3404
+ cctgtg
3405
+ gtcatt
3406
+ gttgtg
3407
+ catgag
3408
+ aagtac
3409
+ gtttaa
3410
+ ccacac
3411
+ tttacg
3412
+ gaccca
3413
+ tatggc
3414
+ agggtc
3415
+ acaggg
3416
+ atttag
3417
+ ttatgg
3418
+ gtgttt
3419
+ tagcgc
3420
+ actccc
3421
+ ccataa
3422
+ gatata
3423
+ ctaaag
3424
+ aacgca
3425
+ gtaata
3426
+ tatata
3427
+ ggcata
3428
+ gtacgg
3429
+ gggtct
3430
+ actacc
3431
+ agtgcg
3432
+ taatcg
3433
+ atggga
3434
+ gccata
3435
+ tgatag
3436
+ gaccct
3437
+ agtggt
3438
+ ctcatg
3439
+ gactac
3440
+ gtgcaa
3441
+ aatgtc
3442
+ tgggac
3443
+ cgcact
3444
+ gtgtgg
3445
+ tattac
3446
+ gagtgc
3447
+ caatgt
3448
+ cggata
3449
+ cccatt
3450
+ agcact
3451
+ ggtagt
3452
+ cgagtg
3453
+ gcactc
3454
+ acagat
3455
+ gatacc
3456
+ cactcg
3457
+ ccgtac
3458
+ acgcac
3459
+ ggagta
3460
+ acattg
3461
+ ggacac
3462
+ agtgct
3463
+ agctat
3464
+ gtagac
3465
+ gggata
3466
+ ctaaat
3467
+ agtgaa
3468
+ tgggtc
3469
+ tgtgct
3470
+ agtcaa
3471
+ tagcaa
3472
+ accact
3473
+ gtctac
3474
+ tatgcc
3475
+ agagag
3476
+ agctaa
3477
+ gacatt
3478
+ gataac
3479
+ aagact
3480
+ cattgt
3481
+ tacctt
3482
+ accctt
3483
+ actgtt
3484
+ ctatca
3485
+ ggtatc
3486
+ cgaatg
3487
+ gtagtt
3488
+ acgact
3489
+ gtccca
3490
+ aacatg
3491
+ ttgcac
3492
+ atagct
3493
+ cacaag
3494
+ gtgcct
3495
+ atctat
3496
+ cctcta
3497
+ tagttt
3498
+ tccgtt
3499
+ ctaatt
3500
+ ggtaag
3501
+ gtactc
3502
+ tatccg
3503
+ acagtt
3504
+ tacagg
3505
+ agtcgt
3506
+ taatgc
3507
+ gtagtc
3508
+ acgaat
3509
+ agactt
3510
+ actaaa
3511
+ aagtct
3512
+ attaac
3513
+ gtgcgt
3514
+ gttatc
3515
+ gcatta
3516
+ atctgt
3517
+ aactgt
3518
+ tctctg
3519
+ acgtga
3520
+ tctact
3521
+ cattcg
3522
+ ttacag
3523
+ atccct
3524
+ acgagt
3525
+ tactcc
3526
+ gtgtcc
3527
+ aactat
3528
+ ttgcta
3529
+ ttcgaa
3530
+ ccctgt
3531
+ gttaat
3532
+ ccaagt
3533
+ caacta
3534
+ taactt
3535
+ cccccc
3536
+ atagtt
3537
+ cagtaa
3538
+ cgaata
3539
+ agttaa
3540
+ tagctt
3541
+ aatgag
3542
+ gatatg
3543
+ tcccat
3544
+ ctttag
3545
+ aggact
3546
+ tgcgtt
3547
+ cttacc
3548
+ gggtaa
3549
+ actcgt
3550
+ gggaca
3551
+ ctgtaa
3552
+ tatatc
3553
+ cctgta
3554
+ cgagta
3555
+ tattcg
3556
+ aatagt
3557
+ atgtgc
3558
+ acttgg
3559
+ tatgga
3560
+ gtactt
3561
+ acctac
3562
+ tcactt
3563
+ aggggt
3564
+ ttgact
3565
+ tagttg
3566
+ attcgt
3567
+ tcacgt
3568
+ attgta
3569
+ gcacat
3570
+ tacaat
3571
+ agtagc
3572
+ agctac
3573
+ cttgtg
3574
+ catgtt
3575
+ tatccc
3576
+ cagtac
3577
+ acccct
3578
+ gctact
3579
+ atgtag
3580
+ agtgat
3581
+ tagcag
3582
+ atgaca
3583
+ gtgaat
3584
+ tactcg
3585
+ gtaaac
3586
+ aactta
3587
+ atgaga
3588
+ ttactg
3589
+ ataccg
3590
+ atagag
3591
+ acacga
3592
+ ttagct
3593
+ tggcta
3594
+ atatga
3595
+ ctacat
3596
+ attcac
3597
+ agtggg
3598
+ agtcct
3599
+ agtctt
3600
+ actatt
3601
+ tttagt
3602
+ attaag
3603
+ gcttac
3604
+ ctctct
3605
+ gtactg
3606
+ ttcact
3607
+ gtagct
3608
+ agtacc
3609
+ acggat
3610
+ cacaat
3611
+ acatga
3612
+ cggtat
3613
+ aggtat
3614
+ gtaagc
3615
+ tagcca
3616
+ tatgat
3617
+ tgtccc
3618
+ ctgcta
3619
+ ttaccc
3620
+ atatgg
3621
+ acgcaa
3622
+ tgttaa
3623
+ gggggg
3624
+ gtaggt
3625
+ agtacg
3626
+ taatgg
3627
+ ataagg
3628
+ attgtg
3629
+ agttat
3630
+ ttacga
3631
+ ctcatt
3632
+ atcact
3633
+ tgctaa
3634
+ cgtacg
3635
+ atccgt
3636
+ catatc
3637
+ ttagca
3638
+ acgcgt
3639
+ gggtag
3640
+ taagga
3641
+ ttaact
3642
+ ctaccc
3643
+ gtttac
3644
+ agtcca
3645
+ tagata
3646
+ taatag
3647
+ ttaaca
3648
+ gtaatg
3649
+ atgcga
3650
+ catgca
3651
+ ttaaga
3652
+ caagta
3653
+ aactaa
3654
+ tccata
3655
+ tacgtc
3656
+ tcgtaa
3657
+ tcacaa
3658
+ tgtcat
3659
+ ggtact
3660
+ ccgtaa
3661
+ cgatac
3662
+ gtatcg
3663
+ caatag
3664
+ tgacag
3665
+ actacg
3666
+ taagtt
3667
+ atacct
3668
+ cccact
3669
+ tggact
3670
+ ataact
3671
+ gacgta
3672
+ aaacgt
3673
+ atcata
3674
+ tgcatg
3675
+ ccatta
3676
+ gtacca
3677
+ tcgcat
3678
+ ctattg
3679
+ gaatgt
3680
+ gcataa
3681
+ atggta
3682
+ agacgt
3683
+ cctaca
3684
+ tgcaca
3685
+ ttacgg
3686
+ gtacag
3687
+ tcgtgt
3688
+ taccga
3689
+ cattac
3690
+ acaagt
3691
+ ctatta
3692
+ tacttg
3693
+ gtggta
3694
+ cttaat
3695
+ ctgtca
3696
+ ttgtga
3697
+ ctctat
3698
+ ataaca
3699
+ ggactc
3700
+ taccac
3701
+ tcggta
3702
+ tcatgt
3703
+ gagtcc
3704
+ tggtac
3705
+ gtacga
3706
+ gtccaa
3707
+ tgtagg
3708
+ attagc
3709
+ cgtact
3710
+ agatac
3711
+ ttatgc
3712
+ tggtta
3713
+ tgtcag
3714
+ tcttaa
3715
+ ttgcgt
3716
+ tctcat
3717
+ gctatg
3718
+ ataaga
3719
+ actaca
3720
+ tagaga
3721
+ ccatat
3722
+ tcatat
3723
+ cccgta
3724
+ taacca
3725
+ ctgaca
3726
+ tgtgca
3727
+ cagtag
3728
+ acgtct
3729
+ aatcta
3730
+ tagatt
3731
+ atactg
3732
+ acattc
3733
+ tacggg
3734
+ acatgc
3735
+ ggttaa
3736
+ ccttat
3737
+ catagc
3738
+ aatacg
3739
+ gatact
3740
+ caagtg
3741
+ atatag
3742
+ atagcg
3743
+ atacag
3744
+ atcaca
3745
+ gctaat
3746
+ ctgtac
3747
+ tcgtac
3748
+ atgcac
3749
+ cgtagt
3750
+ agctta
3751
+ ttggac
3752
+ acttgt
3753
+ ctgaga
3754
+ ctactg
3755
+ agtatc
3756
+ cagtat
3757
+ ttagtt
3758
+ ggatag
3759
+ gggcta
3760
+ tacgaa
3761
+ gcatgt
3762
+ ctacag
3763
+ gcacac
3764
+ tatcta
3765
+ atgggt
3766
+ aatgta
3767
+ atgtca
3768
+ atatgc
3769
+ cacgtg
3770
+ ctatga
3771
+ cagtga
3772
+ ataggc
3773
+ ggctta
3774
+ taagcc
3775
+ gtcaga
3776
+ tcctta
3777
+ ctgtag
3778
+ tgttat
3779
+ acccat
3780
+ gtacaa
3781
+ acgttt
3782
+ tataga
3783
+ ctacac
3784
+ gtgcat
3785
+ tgtgat
3786
+ cataga
3787
+ cgctat
3788
+ attacg
3789
+ taccat
3790
+ tgagag
3791
+ tagccc
3792
+ gcctat
3793
+ ttaacc
3794
+ gcatat
3795
+ tctcag
3796
+ taagct
3797
+ atgtaa
3798
+ tgtagt
3799
+ ggatac
3800
+ taagca
3801
+ cacttg
3802
+ tgacat
3803
+ ttatag
3804
+ tctcta
3805
+ gacaga
3806
+ tactac
3807
+ atagca
3808
+ agtcag
3809
+ ctataa
3810
+ ctatcc
3811
+ gcttaa
3812
+ cctaaa
3813
+ cgtaat
3814
+ gtgtgc
3815
+ aacgtt
3816
+ tgctta
3817
+ tcactg
3818
+ gtatct
3819
+ gtgtag
3820
+ tagtaa
3821
+ ctatat
3822
+ ttcgta
3823
+ tctgac
3824
+ ggtaca
3825
+ gtagta
3826
+ ttacta
3827
+ acgata
3828
+ gatagt
3829
+ tcatag
3830
+ ctctca
3831
+ gagtat
3832
+ cgatag
3833
+ tgtgaa
3834
+ tacatt
3835
+ aacata
3836
+ ctgtat
3837
+ tcttat
3838
+ ttaagc
3839
+ gcgtaa
3840
+ ttgtac
3841
+ cgtatt
3842
+ attaga
3843
+ tctatg
3844
+ tgctat
3845
+ ctgact
3846
+ taaccg
3847
+ cagaca
3848
+ ggctaa
3849
+ gtatcc
3850
+ aggtac
3851
+ cggtta
3852
+ tcagag
3853
+ cagtca
3854
+ tgtacc
3855
+ agacag
3856
+ agcata
3857
+ agtagt
3858
+ ctatcg
3859
+ atactc
3860
+ ttcaca
3861
+ actact
3862
+ tgggta
3863
+ tgactg
3864
+ actatc
3865
+ gggtat
3866
+ ttacat
3867
+ gagagt
3868
+ taccca
3869
+ agtaca
3870
+ ataccc
3871
+ ttaagg
3872
+ cgacta
3873
+ gaatag
3874
+ ttacgc
3875
+ tatgct
3876
+ ttagat
3877
+ gtacct
3878
+ ctacgt
3879
+ agacat
3880
+ atctaa
3881
+ atgagt
3882
+ cactga
3883
+ gtaggg
3884
+ gataca
3885
+ tttagg
3886
+ tatgtt
3887
+ agtcat
3888
+ tatcgt
3889
+ cgtaca
3890
+ gtatca
3891
+ tctata
3892
+ tacaga
3893
+ acttat
3894
+ ccttaa
3895
+ tgatac
3896
+ aacaca
3897
+ atgact
3898
+ tagaat
3899
+ ctctga
3900
+ tagtcg
3901
+ ccctac
3902
+ aggtta
3903
+ agtgca
3904
+ ctatgg
3905
+ tctgtc
3906
+ acgtag
3907
+ tcagtg
3908
+ ttagcc
3909
+ actgac
3910
+ ataagt
3911
+ ggggta
3912
+ ctcaga
3913
+ ggtaac
3914
+ tgtacg
3915
+ actctc
3916
+ ctattc
3917
+ actcat
3918
+ ccatag
3919
+ cagtta
3920
+ tacccc
3921
+ tagtag
3922
+ taaacg
3923
+ tagacg
3924
+ gatagg
3925
+ tgtctg
3926
+ acatta
3927
+ taagcg
3928
+ gtcagt
3929
+ gactga
3930
+ tactga
3931
+ tctaat
3932
+ gggact
3933
+ aatagg
3934
+ ctacta
3935
+ tagaac
3936
+ gtgata
3937
+ attcta
3938
+ agtccc
3939
+ tcagta
3940
+ taactg
3941
+ gttacc
3942
+ atgtat
3943
+ caccta
3944
+ atgtct
3945
+ acttaa
3946
+ agggac
3947
+ actcag
3948
+ cgctta
3949
+ tgcact
3950
+ gttcta
3951
+ tacgat
3952
+ acataa
3953
+ cgtcta
3954
+ taacag
3955
+ taggaa
3956
+ atacat
3957
+ taatgt
3958
+ tctgag
3959
+ tgtact
3960
+ gcatag
3961
+ ctgtct
3962
+ tgtatc
3963
+ gtaagg
3964
+ gtatta
3965
+ gagcta
3966
+ cgttta
3967
+ atcgta
3968
+ aacact
3969
+ agtgtt
3970
+ ctatgc
3971
+ tatcac
3972
+ acacaa
3973
+ cctatc
3974
+ taacct
3975
+ taggtg
3976
+ tgtgtt
3977
+ tcagtc
3978
+ taaggc
3979
+ gtaccc
3980
+ ataacg
3981
+ tctgta
3982
+ gggtac
3983
+ ggttac
3984
+ ttaagt
3985
+ ttatgt
3986
+ tagcga
3987
+ gatacg
3988
+ atagta
3989
+ gagtga
3990
+ tgagtg
3991
+ gcctta
3992
+ gagtaa
3993
+ gtagca
3994
+ taatac
3995
+ ctgagt
3996
+ tatggt
3997
+ ctactc
3998
+ accata
3999
+ ccttac
4000
+ gagtag
4001
+ tcgcta
4002
+ cactca
4003
+ tgctac
4004
+ gtaacc
4005
+ gtgaga
4006
+ ctgtta
4007
+ cctatt
4008
+ tcagac
4009
+ gtccct
4010
+ cacaga
4011
+ tagctc
4012
+ cgtatc
4013
+ atatac
4014
+ gaacta
4015
+ gtctga
4016
+ atagac
4017
+ acagag
4018
+ gtataa
4019
+ ggtatg
4020
+ ggtacc
4021
+ tattag
4022
+ gagaca
4023
+ agggta
4024
+ actaat
4025
+ ttccta
4026
+ tcactc
4027
+ tactat
4028
+ cactac
4029
+ atgtac
4030
+ cgttat
4031
+ agagac
4032
+ agtagg
4033
+ cacacg
4034
+ attagt
4035
+ gtagtg
4036
+ gtagga
4037
+ cttatg
4038
+ ttatac
4039
+ cataag
4040
+ gtatat
4041
+ taagat
4042
+ gtacat
4043
+ aggcta
4044
+ aatgtg
4045
+ tataag
4046
+ atacgg
4047
+ tctcac
4048
+ gctata
4049
+ ctaata
4050
+ cttata
4051
+ ttactc
4052
+ atctta
4053
+ catacc
4054
+ taacgg
4055
+ cgtgtg
4056
+ acggta
4057
+ cctact
4058
+ tatgag
4059
+ gggtta
4060
+ ccgtta
4061
+ ttgtgt
4062
+ tatagc
4063
+ agtaag
4064
+ tcacag
4065
+ tatatg
4066
+ tcctac
4067
+ acctat
4068
+ ataggt
4069
+ gagtta
4070
+ acgcat
4071
+ cagagt
4072
+ gttata
4073
+ agactg
4074
+ taggag
4075
+ tataac
4076
+ tatgca
4077
+ actgag
4078
+ taccgt
4079
+ gtcata
4080
+ tatgac
4081
+ catata
4082
+ taaccc
4083
+ tctgtg
4084
+ atacgc
4085
+ ttagag
4086
+ tgagta
4087
+ cacatt
4088
+ ggtata
4089
+ tgtctc
4090
+ gactat
4091
+ atgcgt
4092
+ ccgtat
4093
+ gtctat
4094
+ ctcata
4095
+ tactca
4096
+ tagttc
4097
+ ctcagt
4098
+ actctg
4099
+ tagcct
4100
+ cttact
4101
+ taacga
4102
+ agtact
4103
+ atagtc
4104
+ gttatg
4105
+ cagact
4106
+ ctgtga
4107
+ tatggg
4108
+ agagta
4109
+ gcgtat
4110
+ taccct
4111
+ ctctgt
4112
+ agtctg
4113
+ ctctaa
4114
+ taactc
4115
+ ctccta
4116
+ gtctct
4117
+ tatacc
4118
+ cctatg
4119
+ acctta
4120
+ catagg
4121
+ tgcata
4122
+ gtatgg
4123
+ aagtgt
4124
+ cataac
4125
+ acatat
4126
+ gtaaga
4127
+ cgctaa
4128
+ taaggt
4129
+ cttaca
4130
+ tagacc
4131
+ tgtaca
4132
+ atatgt
4133
+ taacgc
4134
+ cccata
4135
+ tactaa
4136
+ cagtct
4137
+ tacacg
4138
+ tcgtta
4139
+ ttagta
4140
+ tgtaag
4141
+ taaggg
4142
+ gcgtta
4143
+ gacagt
4144
+ ggtcta
4145
+ ctaaac
4146
+ taggca
4147
+ ttagga
4148
+ ttagcg
4149
+ tcctaa
4150
+ agcgta
4151
+ accgta
4152
+ agtgag
4153
+ agtatg
4154
+ tacggt
4155
+ gtaacg
4156
+ tactta
4157
+ atgtta
4158
+ tgccta
4159
+ gtatga
4160
+ acactt
4161
+ cgtgta
4162
+ taagta
4163
+ ccatac
4164
+ acttac
4165
+ gtgaca
4166
+ actgtc
4167
+ cgttaa
4168
+ cacgta
4169
+ acagac
4170
+ cgtaag
4171
+ gttagc
4172
+ ttaacg
4173
+ tactct
4174
+ cgttac
4175
+ tcttac
4176
+ gagtca
4177
+ agagtg
4178
+ gtttag
4179
+ cttacg
4180
+ gctaac
4181
+ tgtcac
4182
+ acagta
4183
+ gtaagt
4184
+ gttaag
4185
+ tacgct
4186
+ aaccta
4187
+ agtata
4188
+ tacgtg
4189
+ taagag
4190
+ gacata
4191
+ acgtac
4192
+ ccctta
4193
+ gctaag
4194
+ gagact
4195
+ atagga
4196
+ gtacac
4197
+ agtaac
4198
+ tgactc
4199
+ atgtga
4200
+ ctagaa
4201
+ ctcact
4202
+ agtctc
4203
+ gttaca
4204
+ tagtgg
4205
+ catact
4206
+ tataca
4207
+ gtacgt
4208
+ cttaac
4209
+ agttac
4210
+ gcatac
4211
+ cgcata
4212
+ tacatg
4213
+ atacga
4214
+ tcatac
4215
+ gttact
4216
+ tatact
4217
+ taacat
4218
+ gtctgt
4219
+ gtgtac
4220
+ gtatgc
4221
+ tgtata
4222
+ tgacac
4223
+ ctaatg
4224
+ cactct
4225
+ cacatg
4226
+ tcacat
4227
+ tactgt
4228
+ tatgcg
4229
+ tacgga
4230
+ ttctag
4231
+ ccacta
4232
+ catgta
4233
+ actata
4234
+ tatgtc
4235
+ gattag
4236
+ tgtaac
4237
+ cttagc
4238
+ gtaact
4239
+ cataca
4240
+ tgtatg
4241
+ atgcat
4242
+ tatagt
4243
+ catgtg
4244
+ taggtt
4245
+ cattag
4246
+ gtgtca
4247
+ gtaaca
4248
+ ctctta
4249
+ gactca
4250
+ tagggc
4251
+ agttag
4252
+ tccgta
4253
+ tcctat
4254
+ ctaatc
4255
+ tgttac
4256
+ tgagac
4257
+ actatg
4258
+ agagtc
4259
+ gcccta
4260
+ acatag
4261
+ cttaag
4262
+ acacag
4263
+ atgcta
4264
+ tcgtat
4265
+ gttacg
4266
+ agtgac
4267
+ gtctca
4268
+ actcac
4269
+ agccta
4270
+ acagtg
4271
+ cgtaac
4272
+ tagcta
4273
+ tagtta
4274
+ tacagt
4275
+ gtgagt
4276
+ gactct
4277
+ tgagtc
4278
+ gtcact
4279
+ actgta
4280
+ taacta
4281
+ acagtc
4282
+ gcacta
4283
+ gatcta
4284
+ agactc
4285
+ ctatgt
4286
+ acactg
4287
+ tatgta
4288
+ atagtg
4289
+ tagggg
4290
+ ccccta
4291
+ catagt
4292
+ tagatc
4293
+ ctaact
4294
+ gactta
4295
+ cactgt
4296
+ ataggg
4297
+ gactgt
4298
+ gtgtaa
4299
+ tagcat
4300
+ gttaac
4301
+ tacata
4302
+ ttacac
4303
+ taggct
4304
+ gagtct
4305
+ cagtgt
4306
+ tgacta
4307
+ tagtca
4308
+ tgttag
4309
+ tagtgc
4310
+ ctgtgt
4311
+ atacta
4312
+ tagtga
4313
+ attagg
4314
+ cactat
4315
+ ctaaca
4316
+ taagtc
4317
+ cactaa
4318
+ tacgca
4319
+ gttaga
4320
+ tcacta
4321
+ acctaa
4322
+ cctaat
4323
+ ccctat
4324
+ tgcgta
4325
+ ctaacc
4326
+ ggttag
4327
+ taggga
4328
+ ggacta
4329
+ ttagtg
4330
+ tagtat
4331
+ gctagc
4332
+ acacgt
4333
+ taccta
4334
+ cctata
4335
+ tatagg
4336
+ acgtgt
4337
+ ctcaca
4338
+ tagaca
4339
+ taggta
4340
+ tctaac
4341
+ gtcaca
4342
+ cttaga
4343
+ tcccta
4344
+ tagtcc
4345
+ ttaggt
4346
+ cacagt
4347
+ agacac
4348
+ agctag
4349
+ acactc
4350
+ ctaagg
4351
+ gctaga
4352
+ tgtgac
4353
+ gagtgt
4354
+ tgtgag
4355
+ ggccta
4356
+ actgtg
4357
+ atccta
4358
+ tctaag
4359
+ taggcc
4360
+ taggat
4361
+ tctaga
4362
+ gacact
4363
+ gacaca
4364
+ agtcac
4365
+ atacac
4366
+ tagagt
4367
+ ctagct
4368
+ gtgtga
4369
+ gaccta
4370
+ ccttag
4371
+ gtgact
4372
+ ctatag
4373
+ acgtaa
4374
+ tgtcta
4375
+ gtatag
4376
+ ctaagc
4377
+ tcacac
4378
+ taagtg
4379
+ actcta
4380
+ aacgta
4381
+ ctaaga
4382
+ gtgtat
4383
+ gtgtct
4384
+ tctagc
4385
+ gcctaa
4386
+ agtgtc
4387
+ cactta
4388
+ ccctaa
4389
+ ctatac
4390
+ tatgtg
4391
+ tgtgtc
4392
+ ttaggg
4393
+ gcttag
4394
+ taggtc
4395
+ ctagca
4396
+ tgctag
4397
+ ttacgt
4398
+ tacgtt
4399
+ acatac
4400
+ gtatgt
4401
+ cacata
4402
+ tcttag
4403
+ gtgcta
4404
+ ttaggc
4405
+ tagcac
4406
+ actaac
4407
+ gttagt
4408
+ gactaa
4409
+ ctagag
4410
+ catatg
4411
+ taagac
4412
+ taacac
4413
+ gtgtta
4414
+ agacta
4415
+ acgcta
4416
+ ttagtc
4417
+ ctctag
4418
+ gtctta
4419
+ tagcgt
4420
+ acacat
4421
+ aactag
4422
+ atgtgt
4423
+ acttag
4424
+ tacaca
4425
+ tagggt
4426
+ acatgt
4427
+ acccta
4428
+ ctaagt
4429
+ cgtatg
4430
+ catacg
4431
+ gttagg
4432
+ agtgtg
4433
+ cctaac
4434
+ cacact
4435
+ agtgta
4436
+ cacaca
4437
+ tgtgta
4438
+ tagtct
4439
+ tacact
4440
+ actaag
4441
+ ggctag
4442
+ ctagat
4443
+ ctagcc
4444
+ ctagtt
4445
+ tgtgtg
4446
+ cttagt
4447
+ atctag
4448
+ ttagac
4449
+ cgttag
4450
+ gtctaa
4451
+ ctaacg
4452
+ agtcta
4453
+ actaga
4454
+ cctaag
4455
+ acgtta
4456
+ tagact
4457
+ actagc
4458
+ atacgt
4459
+ acgtat
4460
+ taacgt
4461
+ cgctag
4462
+ ctagcg
4463
+ tatacg
4464
+ cttagg
4465
+ gtacta
4466
+ gctagt
4467
+ tagtac
4468
+ gctagg
4469
+ acacac
4470
+ gtatac
4471
+ cctagc
4472
+ tctagt
4473
+ cgtata
4474
+ acacta
4475
+ gtgtgt
4476
+ taggac
4477
+ tagtgt
4478
+ gtccta
4479
+ cctaga
4480
+ tctagg
4481
+ ctaggg
4482
+ ctagga
4483
+ ccctag
4484
+ tactag
4485
+ tcctag
4486
+ ctagta
4487
+ cactag
4488
+ tacgta
4489
+ ctagtg
4490
+ ctaggc
4491
+ gcctag
4492
+ ctagac
4493
+ acctag
4494
+ gtctag
4495
+ ctaggt
4496
+ actagg
4497
+ cctagt
4498
+ actagt
4499
+ gactag
4500
+ ctagtc
4501
+ cctagg
4502
+ se
4503
+ ##ce
4504
+ ##en
4505
+ ##qu
4506
+ sequ
4507
+ ##ces
4508
+ ##ences
4509
+ sequences
1_CNN/cnn_config.json ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "in_word_embedding_dimension": 768,
3
+ "out_channels": 256,
4
+ "kernel_sizes": [
5
+ 1,
6
+ 3,
7
+ 5
8
+ ]
9
+ }
1_CNN/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a98b8edae95825531e7eb83cb74b01846514f3ddee054ba58a124c145a313505
3
+ size 7081448
2_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
3_Dense/config.json ADDED
@@ -0,0 +1 @@
 
 
1
+ {"in_features": 768, "out_features": 512, "bias": true, "activation_function": "torch.nn.modules.activation.ReLU"}
3_Dense/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:95cce1529f5f7093f311234b819dd1109ebe9d5b36cda3a5647a289b80a3dc55
3
+ size 1575072
README.md ADDED
@@ -0,0 +1,155 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ datasets: []
3
+ language: []
4
+ library_name: sentence-transformers
5
+ pipeline_tag: sentence-similarity
6
+ tags:
7
+ - sentence-transformers
8
+ - sentence-similarity
9
+ - feature-extraction
10
+ widget: []
11
+ ---
12
+
13
+ # SentenceTransformer
14
+
15
+ This is a [sentence-transformers](https://www.SBERT.net) model trained. It maps sentences & paragraphs to a 512-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
16
+
17
+ ## Model Details
18
+
19
+ ### Model Description
20
+ - **Model Type:** Sentence Transformer
21
+ <!-- - **Base model:** [Unknown](https://huggingface.co/unknown) -->
22
+ - **Maximum Sequence Length:** 512 tokens
23
+ - **Output Dimensionality:** 512 tokens
24
+ - **Similarity Function:** Cosine Similarity
25
+ <!-- - **Training Dataset:** Unknown -->
26
+ <!-- - **Language:** Unknown -->
27
+ <!-- - **License:** Unknown -->
28
+
29
+ ### Model Sources
30
+
31
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
32
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
33
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
34
+
35
+ ### Full Model Architecture
36
+
37
+ ```
38
+ SentenceTransformer(
39
+ (0): SentenceTransformer(
40
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: MPNetModel
41
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
42
+ )
43
+ (1): CNN(
44
+ (convs): ModuleList(
45
+ (0): Conv1d(768, 256, kernel_size=(1,), stride=(1,))
46
+ (1): Conv1d(768, 256, kernel_size=(3,), stride=(1,), padding=(1,))
47
+ (2): Conv1d(768, 256, kernel_size=(5,), stride=(1,), padding=(2,))
48
+ )
49
+ )
50
+ (2): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
51
+ (3): Dense({'in_features': 768, 'out_features': 512, 'bias': True, 'activation_function': 'torch.nn.modules.activation.ReLU'})
52
+ (4): Normalize()
53
+ )
54
+ ```
55
+
56
+ ## Usage
57
+
58
+ ### Direct Usage (Sentence Transformers)
59
+
60
+ First install the Sentence Transformers library:
61
+
62
+ ```bash
63
+ pip install -U sentence-transformers
64
+ ```
65
+
66
+ Then you can load this model and run inference.
67
+ ```python
68
+ from sentence_transformers import SentenceTransformer
69
+
70
+ # Download from the 🤗 Hub
71
+ model = SentenceTransformer("dsfsi/dna-paraphrase-mpnet-base-v2")
72
+ # Run inference
73
+ sentences = [
74
+ 'The weather is lovely today.',
75
+ "It's so sunny outside!",
76
+ 'He drove to the stadium.',
77
+ ]
78
+ embeddings = model.encode(sentences)
79
+ print(embeddings.shape)
80
+ # [3, 512]
81
+
82
+ # Get the similarity scores for the embeddings
83
+ similarities = model.similarity(embeddings, embeddings)
84
+ print(similarities.shape)
85
+ # [3, 3]
86
+ ```
87
+
88
+ <!--
89
+ ### Direct Usage (Transformers)
90
+
91
+ <details><summary>Click to see the direct usage in Transformers</summary>
92
+
93
+ </details>
94
+ -->
95
+
96
+ <!--
97
+ ### Downstream Usage (Sentence Transformers)
98
+
99
+ You can finetune this model on your own dataset.
100
+
101
+ <details><summary>Click to expand</summary>
102
+
103
+ </details>
104
+ -->
105
+
106
+ <!--
107
+ ### Out-of-Scope Use
108
+
109
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
110
+ -->
111
+
112
+ <!--
113
+ ## Bias, Risks and Limitations
114
+
115
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
116
+ -->
117
+
118
+ <!--
119
+ ### Recommendations
120
+
121
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
122
+ -->
123
+
124
+ ## Training Details
125
+
126
+ ### Framework Versions
127
+ - Python: 3.8.10
128
+ - Sentence Transformers: 3.0.1
129
+ - Transformers: 4.43.4
130
+ - PyTorch: 2.4.0+cu121
131
+ - Accelerate:
132
+ - Datasets:
133
+ - Tokenizers: 0.19.1
134
+
135
+ ## Citation
136
+
137
+ ### BibTeX
138
+
139
+ <!--
140
+ ## Glossary
141
+
142
+ *Clearly define terms in order to be accessible across audiences.*
143
+ -->
144
+
145
+ <!--
146
+ ## Model Card Authors
147
+
148
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
149
+ -->
150
+
151
+ <!--
152
+ ## Model Card Contact
153
+
154
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
155
+ -->
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.43.4",
5
+ "pytorch": "2.4.0+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
modules.json ADDED
@@ -0,0 +1,32 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "0_SentenceTransformer",
6
+ "type": "sentence_transformers.SentenceTransformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_CNN",
12
+ "type": "sentence_transformers.models.CNN"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Pooling",
18
+ "type": "sentence_transformers.models.Pooling"
19
+ },
20
+ {
21
+ "idx": 3,
22
+ "name": "3",
23
+ "path": "3_Dense",
24
+ "type": "sentence_transformers.models.Dense"
25
+ },
26
+ {
27
+ "idx": 4,
28
+ "name": "4",
29
+ "path": "4_Normalize",
30
+ "type": "sentence_transformers.models.Normalize"
31
+ }
32
+ ]