Lajavaness
/

bilingual-embedding-small

Sentence Similarity

sentence-transformers

feature-extraction

sentence-embedding

Model card Files Files and versions

dangvantuan commited on 25 days ago

Commit

80f7adb

·

verified ·

1 Parent(s): ed4a1dd

Update README.md

Files changed (1) hide show

README.md +5 -1

README.md CHANGED Viewed

@@ -8108,7 +8108,7 @@ language:
 # [bilingual-embedding-small](https://huggingface.co/Lajavaness/bilingual-embedding-small)
-Bilingual-embedding is the Embedding Model for bilingual language: french and english. This model is a specialized sentence-embedding trained specifically for the bilingual language, leveraging the robust capabilities of [Multilingual-MiniLM-L12-H384](https://huggingface.co/microsoft/Multilingual-MiniLM-L12-H384), a pre-trained language model  is built upon [multilingual-e5](https://huggingface.co/intfloat/multilingual-e5-small) architecture. The model utilizes MiniLM to encode english-french sentences into a 1024-dimensional vector space, facilitating a wide range of applications from semantic search to text clustering. The embeddings capture the nuanced meanings of english-french sentences, reflecting both the lexical and contextual layers of the language.
 ## Full Model Architecture
@@ -8148,6 +8148,10 @@ from sentence_transformers import SentenceTransformer
 sentences = ["Paris est une capitale de la France", "Paris is a capital of France"]
 model = SentenceTransformer('Lajavaness/bilingual-embedding-small', trust_remote_code=True)
 print(embeddings)
 ```

 # [bilingual-embedding-small](https://huggingface.co/Lajavaness/bilingual-embedding-small)
+Bilingual-embedding is the Embedding Model for bilingual language: french and english. This model is a specialized sentence-embedding trained specifically for the bilingual language, leveraging the robust capabilities of [Multilingual-MiniLM-L12-H384](https://huggingface.co/microsoft/Multilingual-MiniLM-L12-H384), a pre-trained language model  is built upon [multilingual-e5](https://huggingface.co/intfloat/multilingual-e5-small) architecture. The model utilizes MiniLM to encode english-french sentences into a 384-dimensional vector space, facilitating a wide range of applications from semantic search to text clustering. The embeddings capture the nuanced meanings of english-french sentences, reflecting both the lexical and contextual layers of the language.
 ## Full Model Architecture
 sentences = ["Paris est une capitale de la France", "Paris is a capital of France"]
 model = SentenceTransformer('Lajavaness/bilingual-embedding-small', trust_remote_code=True)
+embeddings = model.encode(sentences)
 print(embeddings)
 ```