Vidore

company

https://github.com/illuin-tech/colpali

Activity Feed

AI & ML interests

Retrieval, Computer Vision, LLM

Recent Activity

paultltc authored a paper 5 days ago

LLaMa-SciQ: An Educational Chatbot for Answering Science MCQ

paultltc authored a paper 5 days ago

Enhancing Inflation Nowcasting with LLM: Sentiment Analysis on News

paultltc authored a paper 5 days ago

Apertus: Democratizing Open and Compliant LLMs for Global Language Environments

View all activity

vidore 's collections 11

ViDoRe Benchmark V3

ViDoRe V3 is our latest benchmark, engineered to set a new industry gold standard for multi-modal, enterprise document retrieval evaluation.

vidore/vidore_v3_hr

Viewer • Updated 13 days ago • 13.4k • 11.2k • 6
vidore/vidore_v3_finance_en

Viewer • Updated 13 days ago • 13.6k • 11.9k • 4
vidore/vidore_v3_industrial

Viewer • Updated 13 days ago • 16.7k • 11.5k • 3
vidore/vidore_v3_pharmaceuticals

Viewer • Updated 13 days ago • 14.9k • 11.3k • 1

ColPali Models

Pre-trained checkpoints for the ColPali model.

vidore/colpali-v1.3-merged

3B • Updated Aug 4 • 8
vidore/colpali-v1.3

Visual Document Retrieval • Updated Mar 14 • 37.3k • 83
vidore/colpali-v1.2-merged

Visual Document Retrieval • 3B • Updated Feb 5 • 7
vidore/colpali-v1.2

Visual Document Retrieval • Updated Mar 14 • 335k • 112

ColSmolVLM

Pre-trained checkpoints for the ColVision models with a ColSmolVLM backbone.

vidore/colSmol-500M

Visual Document Retrieval • Updated Mar 14 • 1.79k • 20
vidore/colSmol-256M

Visual Document Retrieval • Updated Mar 14 • 2.63k • 17

ViDoRe Benchmark

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the QA format.

vidore/arxivqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 754 • 4
vidore/docvqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 794 • 4
vidore/infovqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 798 • 3
vidore/tabfquad_test_subsampled

Viewer • Updated Jun 20 • 280 • 786

ViDoRe Chunk OCR (baseline)

The ViDoRe benchmark was passed to Unstructured to partition each page into text chunks. Detected figures/tables were captioned with Claude 3-Sonnet.

vidore/arxivqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.44k • 43
vidore/docvqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.24k • 61
vidore/infovqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 2.78k • 47
vidore/tabfquad_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 636 • 35

ViDoRe Page OCR (artifact)

ViDoRe benchmark with the full OCR text of each page. ⚠️ This dataset serves a intermediate step → use "ViDoRe Chunk OCR (baseline)" for evaluation!

vidore/arxivqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 47
vidore/docvqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 46
vidore/infovqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 106
vidore/tabfquad_test_subsampled_tesseract

Viewer • Updated Jun 20 • 280 • 34

ViDoRe Benchmark v2

vidore/esg_reports_v2

Viewer • Updated Jul 2 • 2.91k • 16.6k • 1
vidore/biomedical_lectures_v2

Viewer • Updated Jul 2 • 3.74k • 15.9k
vidore/economics_reports_v2

Viewer • Updated Jul 2 • 4.32k • 15.6k
vidore/esg_reports_human_labeled_v2

Viewer • Updated Jul 2 • 1.72k • 15.8k

ColQwen2 Models

Pre-trained checkpoints for the ColQwen2 model.

vidore/colqwen2-v1.0-merged

Visual Document Retrieval • 2B • Updated Apr 16 • 18
vidore/colqwen2-v1.0

Visual Document Retrieval • Updated Jun 5 • 42.7k • 116
vidore/colqwen2-v0.1-merged

2B • Updated Mar 8 • 2
vidore/colqwen2-v0.1

Visual Document Retrieval • Updated Mar 21 • 80.4k • 193

Hf-native ColVision Models

Models that can be used with the native transformers 🤗 implementation instead of colpali-engine.

vidore/colqwen2-v1.0-hf

Visual Document Retrieval • 2B • Updated Jun 2 • 3.63k • 21
vidore/colpali-v1.3-hf

Visual Document Retrieval • 3B • Updated Apr 16 • 1.92k • 26
vidore/colpali-v1.2-hf

Visual Document Retrieval • 3B • Updated Apr 16 • 1.75k • 8
Sahil-Kabir/colqwen2.5-v0.2-hf

4B • Updated Sep 13 • 869

ViDoRe Benchmark (BEIR)

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the BEIR format.

vidore/arxivqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.5k • 7.71k • 1
vidore/docvqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.45k • 6.79k
vidore/infovqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.49k • 6.04k
vidore/tabfquad_test_subsampled_beir

Viewer • Updated Jun 20 • 630 • 5.61k

ColPali Paper Resources

Main resources for the paper: "ColPali: Efficient Document Retrieval with Vision Language Models"

ColPali: Efficient Document Retrieval with Vision Language Models

Paper • 2407.01449 • Published Jun 27, 2024 • 50
vidore/colpali

Visual Document Retrieval • Updated Nov 24 • 6.49k • 467
vidore/colpali_train_set

Viewer • Updated Jun 20 • 119k • 4.75k • 88
Running

192

Vidore Leaderboard

🥇

192

Browse and compare visual document retrieval models

ViDoRe Benchmark V3

ViDoRe V3 is our latest benchmark, engineered to set a new industry gold standard for multi-modal, enterprise document retrieval evaluation.

vidore/vidore_v3_hr

Viewer • Updated 13 days ago • 13.4k • 11.2k • 6
vidore/vidore_v3_finance_en

Viewer • Updated 13 days ago • 13.6k • 11.9k • 4
vidore/vidore_v3_industrial

Viewer • Updated 13 days ago • 16.7k • 11.5k • 3
vidore/vidore_v3_pharmaceuticals

Viewer • Updated 13 days ago • 14.9k • 11.3k • 1

ViDoRe Benchmark v2

vidore/esg_reports_v2

Viewer • Updated Jul 2 • 2.91k • 16.6k • 1
vidore/biomedical_lectures_v2

Viewer • Updated Jul 2 • 3.74k • 15.9k
vidore/economics_reports_v2

Viewer • Updated Jul 2 • 4.32k • 15.6k
vidore/esg_reports_human_labeled_v2

Viewer • Updated Jul 2 • 1.72k • 15.8k

ColPali Models

Pre-trained checkpoints for the ColPali model.

vidore/colpali-v1.3-merged

3B • Updated Aug 4 • 8
vidore/colpali-v1.3

Visual Document Retrieval • Updated Mar 14 • 37.3k • 83
vidore/colpali-v1.2-merged

Visual Document Retrieval • 3B • Updated Feb 5 • 7
vidore/colpali-v1.2

Visual Document Retrieval • Updated Mar 14 • 335k • 112

ColQwen2 Models

Pre-trained checkpoints for the ColQwen2 model.

vidore/colqwen2-v1.0-merged

Visual Document Retrieval • 2B • Updated Apr 16 • 18
vidore/colqwen2-v1.0

Visual Document Retrieval • Updated Jun 5 • 42.7k • 116
vidore/colqwen2-v0.1-merged

2B • Updated Mar 8 • 2
vidore/colqwen2-v0.1

Visual Document Retrieval • Updated Mar 21 • 80.4k • 193

ColSmolVLM

Pre-trained checkpoints for the ColVision models with a ColSmolVLM backbone.

vidore/colSmol-500M

Visual Document Retrieval • Updated Mar 14 • 1.79k • 20
vidore/colSmol-256M

Visual Document Retrieval • Updated Mar 14 • 2.63k • 17

Hf-native ColVision Models

Models that can be used with the native transformers 🤗 implementation instead of colpali-engine.

vidore/colqwen2-v1.0-hf

Visual Document Retrieval • 2B • Updated Jun 2 • 3.63k • 21
vidore/colpali-v1.3-hf

Visual Document Retrieval • 3B • Updated Apr 16 • 1.92k • 26
vidore/colpali-v1.2-hf

Visual Document Retrieval • 3B • Updated Apr 16 • 1.75k • 8
Sahil-Kabir/colqwen2.5-v0.2-hf

4B • Updated Sep 13 • 869

ViDoRe Benchmark

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the QA format.

vidore/arxivqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 754 • 4
vidore/docvqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 794 • 4
vidore/infovqa_test_subsampled

Viewer • Updated Jun 20 • 500 • 798 • 3
vidore/tabfquad_test_subsampled

Viewer • Updated Jun 20 • 280 • 786

ViDoRe Benchmark (BEIR)

Benchmark for document retrieval using visual features, introduced in the ColPali paper. Datasets are using the BEIR format.

vidore/arxivqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.5k • 7.71k • 1
vidore/docvqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.45k • 6.79k
vidore/infovqa_test_subsampled_beir

Viewer • Updated Jun 20 • 1.49k • 6.04k
vidore/tabfquad_test_subsampled_beir

Viewer • Updated Jun 20 • 630 • 5.61k

ViDoRe Chunk OCR (baseline)

The ViDoRe benchmark was passed to Unstructured to partition each page into text chunks. Detected figures/tables were captioned with Claude 3-Sonnet.

vidore/arxivqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.44k • 43
vidore/docvqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 1.24k • 61
vidore/infovqa_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 2.78k • 47
vidore/tabfquad_test_subsampled_ocr_chunk

Viewer • Updated Jun 13, 2024 • 636 • 35

ColPali Paper Resources

Main resources for the paper: "ColPali: Efficient Document Retrieval with Vision Language Models"

ColPali: Efficient Document Retrieval with Vision Language Models

Paper • 2407.01449 • Published Jun 27, 2024 • 50
vidore/colpali

Visual Document Retrieval • Updated Nov 24 • 6.49k • 467
vidore/colpali_train_set

Viewer • Updated Jun 20 • 119k • 4.75k • 88
Running

192

Vidore Leaderboard

🥇

192

Browse and compare visual document retrieval models

ViDoRe Page OCR (artifact)

ViDoRe benchmark with the full OCR text of each page. ⚠️ This dataset serves a intermediate step → use "ViDoRe Chunk OCR (baseline)" for evaluation!

vidore/arxivqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 47
vidore/docvqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 46
vidore/infovqa_test_subsampled_tesseract

Viewer • Updated Jun 20 • 500 • 106
vidore/tabfquad_test_subsampled_tesseract

Viewer • Updated Jun 20 • 280 • 34

AI & ML interests

Recent Activity

Team members 9

vidore 's collections 11

Vidore Leaderboard

Vidore Leaderboard

🎉 Free Image Generator Now Available!