sbert_nli_test_m / README.md
akhooli's picture
Upload folder using huggingface_hub
f2da7cd verified
metadata
base_model: aubmindlab/bert-base-arabertv02
language:
  - ar
library_name: sentence-transformers
license: apache-2.0
pipeline_tag: sentence-similarity
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:550000
  - loss:Matryoshka2dLoss
  - loss:MatryoshkaLoss
  - loss:MultipleNegativesRankingLoss
widget:
  - source_sentence: كم فدان بحيرة رونكونكوما
    sentences:
      - >-
        أبعاد بحيرة Ronkonkoma - تختلف من 215 فدانًا عندما يكون هناك جفاف إلى
        275 فدانًا عندما تكون هناك ظروف غمرتها المياه. - متوسط ​​العمق 14.5 قدم.
        - أعمق أعماق 45 قدم. و 90 قدمًا. في المناطق الجنوبية الغربية.
      - >-
        يقع Alpine Lake Resort في أعالي جبال West Virginia Alleghenies ، على بعد
        25 دقيقة فقط من مناطق الجذب السياحي Deep Creek Lake وساعة واحدة من
        Morgantown WV ، ويقع على مساحة 2000 فدان مشجرة بكثافة مع ملعب غولف من 18
        حفرة حائز على جوائز وبحيرة نقية مساحتها 150 فدانًا تغذيها الينابيع
        والجداول الجبلية كنقطة محورية للمنتجع.
      - >-
        إجابة جيكم يونغ. صوت الثقة 36.1 ألف. مايكل دي هيغينز هو رئيس أيرلندا. تم
        انتخابه كرئيس 9th لأيرلندا وتولى منصبه في 11 نوفمبر 2011 لمدة 7 سنوات ،
        وبالتالي يجب أن يظل في منصبه حتى نوفمبر 2018.
  - source_sentence: ما مقدار الأخطاء الطبية التي يقوم بها المحامون
    sentences:
      - >-
        العديد من محامي سوء الممارسة الطبية يعملون لحسابهم الخاص ، وبعضهم شركاء
        في مكاتب المحاماة. بالنسبة لهؤلاء المحامين ، تعتمد الأرباح على مكاسب
        الدعاوى القضائية ، لأن الشركاء والممارسين الفرديين لا يحصلون عادةً على
        رواتب. وفقًا لموقع LawFirms.com ، يتم تسوية متوسط ​​حالة سوء الممارسة
        الطبية بمبلغ 425000 دولار.
      - >-
        تم تطوير عقار ثاليدومايد غثيان الصباح ، الذي تسبب في إنجاب النساء
        الحوامل لأطفال بدون ذراعين وأرجل ، لأول مرة من قبل النازيين ، ربما كجزء
        من برنامج أسلحتهم الكيميائية ، وفقًا لبحث جديد. تم تطويره لأول مرة من
        قبل علماء يعملون في ألمانيا في زمن الحرب ، ويمكن أن يكون له آثار على
        مسؤولية الحكومة الألمانية. ولم تقدم حتى الآن تعويضات إلا للضحايا الألمان
        ، على الرغم من أن العقار تم توزيعه في 46 دولة.
      - >-
        في التقاضي المدني ، مثل دعوى سوء الممارسة الطبية ، يتحمل المدعي (الطرف
        المتضرر) عبء الإثبات. هذا يعني أنه يجب أن تكون قادرًا على إثبات ، وفقًا
        للمعايير القانونية المطلوبة ، أن: مقدمو الرعاية الصحية الذين تريد
        مقاضاتهم ارتكبوا بالفعل خطأ في الرعاية التي قدموها لك ؛ و.
  - source_sentence: الذي كان متزوج بيلي جويل
    sentences:
      - >-
        يقيس اختبار alanine aminotransferase (ALT) كمية هذا الإنزيم في الدم.
        يوجد ALT بشكل رئيسي في الكبد ، ولكن أيضًا بكميات أقل في الكلى والقلب
        والعضلات والبنكرياس. كان ALT يُسمى سابقًا ترانساميناز الجلوتاميك
        البيروفي (SGPT).
      - >-
        ما هي الشاحنة التي قادها بيلي بوب في موسيقى البلوز؟ يجيب kgb Ã⠀ Ã'ÂÃ'Â
        »Arts & Entertainment â € » أفلام »ما هي الشاحنة التي قادها بيلي بوب في
        موسيقى البلوز؟ كانت شاحنة بيلي بوب 78-79 LWB 4X4 في فيلم فارسيتي بلوز.
        اكتب kgb_ أي شيء ، 24/7! العلامات: اسكواش البلوز ، بيلي بوب.
      - >-
        في عام 1985 ، للموسيقي بيلي جويل (مواليد 9 مايو 1949) ؛ انتهى الزواج في
        عام 1994 وأنجب طفلاً واحدًا هو أليكسا راي جويل. التقى برينكلي وجويل في
        عام 1983 في جزيرة سانت بارتس في منطقة البحر الكاريبي وتزوجا في 23 مارس
        1985 على متن يخت على نهر هدسون ، وهو الزواج الثاني لكليهما.
  - source_sentence: لعبة باما مسو 2015
    sentences:
      - "\"الخليج الفارسي (الفارسية: خà \"ØÂÂØÂÂØ\_Â 'ŽÃ\_¢ ، العربية: اÃ℠¢ \"ج Ø\_Ã \"\"¢\"\" هو البحر الأبيض المتوسط ​​في غرب آسيا. المسطح المائي هو امتداد للمحيط الهندي (خليج عمان) عبر مضيق هرمز ويقع بين إيران في الشمال الشرقي وشبه الجزيرة العربية إلى الجنوب الغربي.\""
      - >-
        إنها واشنطن ريد سكينز ضد كليفلاند براونز الساعة 8 مساءً. (التوقيت
        الشرقي) على NBC و CSN في الأسبوع 1 من 2015 قبل الموسم. اعثر على معلومات
        هنا حول وقت لعبة Redskins-Browns ، والقناة التلفزيونية التي يتم تشغيلها
        ، وجدول Redskins الكامل لعام 2015 ، وكيفية البث المباشر عبر الإنترنت ،
        والاحتمالات ، والمذيعين ، والمختارات والمزيد. سقسقة شارك.
      - >-
        إعادة التشغيل: وفقًا لجدول DirecTV الخاص بي ، فإن أول إعادة للعبة
        MSU-Alabama تكون في الساعة 3:30 صباحًا يوم الأحد ، 17 نوفمبر على ESPN ،
        ومرة ​​أخرى في ظهر يوم الثلاثاء التالي ظهر يوم ESPNU.
  - source_sentence: هل يمكنك تناول lortab أثناء الحمل
    sentences:
      - >-
        نعم ، هل يمكنني تناول عقار لورتاب 10 طوال فترة حملي بسبب وجود ورم في
        مبيضي وفي كثير من الألم بسبب نمو الطفل والضغط عليه ، لذلك لمدة 9 أشهر
        كنت أعاني من مسكنات الألم كنت قلقة من البداية ولكن بعد ذلك بالتحدث مع
        طبيبي وحماتي التي هي RN وجدت الأمر على ما يرام.
      - >-
        حتى أن بعض النساء لا يلاحظن نزيفًا أو تشنجًا عند الانغراس ، لذلك لا
        تقلقي إذا كنتِ تحاولين الحمل ولا تعانين من هذه الأعراض ؛ لا يزال من
        الممكن أن تكوني حامل. الدورة الشهرية المتأخرة أو الفائتة: تأخر الدورة
        الشهرية أو ضياعها هو أكثر أعراض الحمل شيوعًا التي تدفع المرأة إلى اختبار
        الحمل. عندما تصبحي حاملاً ، يجب تفويت الدورة التالية. ومع ذلك ، يمكن أن
        تنزف بعض النساء أثناء الحمل ، ولكن عادةً ما يكون هذا النزيف أقصر أو أخف
        من الدورة العادية.
      - >-
        الحفاظ على ازدهار الأوركيد الخاص بك لأطول فترة ممكنة - عند زراعة
        الأوركيد ، فأنت تريد التأكد من أن الزهور تدوم لأطول فترة ممكنة. كم من
        الوقت تدوم أزهار الأوركيد ، تعتمد بشكل كبير على تنوع الأوركيد بالإضافة
        إلى الرعاية التي تتلقاها الأزهار. أزهار فالاينوبسيس ، وهي واحدة من أكثر
        الأنواع شيوعًا ، تتفتح عادةً مرة أو مرتين في السنة ويمكن أن تستمر
        الإزهار في أي مكان من 60 إلى 120 يومًا.

BERT base trained on Arabic NLI triplets

This is a sentence-transformers model finetuned from aubmindlab/bert-base-arabertv02. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: aubmindlab/bert-base-arabertv02
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 768 tokens
  • Similarity Function: Cosine Similarity
  • Language: ar
  • License: apache-2.0

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'هل يمكنك تناول lortab أثناء الحمل',
    'نعم ، هل يمكنني تناول عقار لورتاب 10 طوال فترة حملي بسبب وجود ورم في مبيضي وفي كثير من الألم بسبب نمو الطفل والضغط عليه ، لذلك لمدة 9 أشهر كنت أعاني من مسكنات الألم كنت قلقة من البداية ولكن بعد ذلك بالتحدث مع طبيبي وحماتي التي هي RN وجدت الأمر على ما يرام.',
    'حتى أن بعض النساء لا يلاحظن نزيفًا أو تشنجًا عند الانغراس ، لذلك لا تقلقي إذا كنتِ تحاولين الحمل ولا تعانين من هذه الأعراض ؛ لا يزال من الممكن أن تكوني حامل. الدورة الشهرية المتأخرة أو الفائتة: تأخر الدورة الشهرية أو ضياعها هو أكثر أعراض الحمل شيوعًا التي تدفع المرأة إلى اختبار الحمل. عندما تصبحي حاملاً ، يجب تفويت الدورة التالية. ومع ذلك ، يمكن أن تنزف بعض النساء أثناء الحمل ، ولكن عادةً ما يكون هذا النزيف أقصر أو أخف من الدورة العادية.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • learning_rate: 2e-05
  • num_train_epochs: 1
  • warmup_ratio: 0.1
  • fp16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • eval_use_gather_object: False
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss
0.032 100 3.9312
0.064 200 2.1973
0.096 300 1.523
0.128 400 1.1944
0.16 500 1.0914
0.192 600 1.0172
0.224 700 0.8261
0.256 800 0.9473
0.288 900 0.9046
0.32 1000 0.815
0.352 1100 0.7333
0.384 1200 0.813
0.416 1300 0.8193
0.448 1400 0.8222
0.48 1500 0.7751
0.512 1600 0.7857
0.544 1700 0.7048
0.576 1800 0.7802
0.608 1900 0.7697
0.64 2000 0.697
0.672 2100 0.697
0.704 2200 0.6942
0.736 2300 0.6768
0.768 2400 0.6977
0.8 2500 0.6711
0.832 2600 0.6951
0.864 2700 0.7179
0.896 2800 0.6223
0.928 2900 0.7334
0.96 3000 0.6948
0.992 3100 0.6982

Framework Versions

  • Python: 3.10.12
  • Sentence Transformers: 3.1.1
  • Transformers: 4.44.2
  • PyTorch: 2.4.1+cu121
  • Accelerate: 0.34.2
  • Datasets: 3.0.1
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

Matryoshka2dLoss

@misc{li20242d,
    title={2D Matryoshka Sentence Embeddings},
    author={Xianming Li and Zongxi Li and Jing Li and Haoran Xie and Qing Li},
    year={2024},
    eprint={2402.14776},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}