Update README.md
Browse files
README.md
CHANGED
@@ -29,7 +29,7 @@ tokenizer = AutoTokenizer.from_pretrained("Voicelab/sherbert-base-cased")
|
|
29 |
s0 = "Uczenie maszynowe jest konsekwencją rozwoju idei sztucznej inteligencji i metod jej wdrażania praktycznego."
|
30 |
s1 = "Głębokie uczenie maszynowe jest sktukiem wdrażania praktycznego metod sztucznej inteligencji oraz jej rozwoju."
|
31 |
s2 = "Kasparow zarzucił firmie IBM oszustwo, kiedy odmówiła mu dostępu do historii wcześniejszych gier Deep Blue. "
|
32 |
-
|
33 |
|
34 |
tokens = tokenizer([s0, s1, s2],
|
35 |
padding=True,
|
@@ -45,7 +45,14 @@ print(pairwise.cosine_similarity(x[0], x[1])) # Result: 0.7952354
|
|
45 |
print(pairwise.cosine_similarity(x[0], x[2))) # Result: 0.42359722
|
46 |
|
47 |
```
|
48 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
49 |
|
50 |
# License
|
51 |
|
|
|
29 |
s0 = "Uczenie maszynowe jest konsekwencją rozwoju idei sztucznej inteligencji i metod jej wdrażania praktycznego."
|
30 |
s1 = "Głębokie uczenie maszynowe jest sktukiem wdrażania praktycznego metod sztucznej inteligencji oraz jej rozwoju."
|
31 |
s2 = "Kasparow zarzucił firmie IBM oszustwo, kiedy odmówiła mu dostępu do historii wcześniejszych gier Deep Blue. "
|
32 |
+
base
|
33 |
|
34 |
tokens = tokenizer([s0, s1, s2],
|
35 |
padding=True,
|
|
|
45 |
print(pairwise.cosine_similarity(x[0], x[2))) # Result: 0.42359722
|
46 |
|
47 |
```
|
48 |
+
# Results
|
49 |
+
|
50 |
+
| Model | Accuracy | Source |
|
51 |
+
|--------------------------|------------|---------------------------------------------------------|
|
52 |
+
| SBERT-WikiSec-base (EN) | 80.42% | https://arxiv.org/abs/1908.10084 |
|
53 |
+
| SBERT-WikiSec-large (EN) | 80.78% | https://arxiv.org/abs/1908.10084 |
|
54 |
+
| **SHerbert-base (PL)** | **82.31%** | **https://huggingface.co/Voicelab/sherbert-base-cased** |
|
55 |
+
| SHerbert-large (PL) | 84.42% | https://huggingface.co/Voicelab/sherbert-large-cased |
|
56 |
|
57 |
# License
|
58 |
|