Name: MLQA - Multilingual Question-Answering
Creator: Kaggle
License: https://creativecommons.org/publicdomain/zero/1.0/

About this Dataset

MLQA - Multilingual Question-Answering

Multilingual Question-Answering Dataset

By mlqa (From Huggingface) [source]

About this dataset

The dataset consists of several files in CSV format that provide context passages or paragraphs along with corresponding questions and answer options. The context passages serve as the source of information from which the questions are derived, and the answer options are potential answers to these questions.

Each file in the dataset contains different language combinations for evaluation purposes. For example, mlqa.es.zh_test.csv focuses on testing multilingual question-answering models in Spanish and Chinese languages. Similarly, mlqa.hi.de_test.csv provides test data specifically for evaluating Hindi-German language pairs.

In order to facilitate accurate evaluation of models' performance, each file includes multiple columns for context and answers. This allows researchers to assess how well their models can generate correct answers based on the given contexts.

Research Ideas

Evaluation of multilingual question-answering models: This dataset can be used to evaluate the performance of different models designed for multilingual question-answering. By providing context, question, and answer pairs in multiple languages, it allows researchers to measure the accuracy and effectiveness of their models across different language pairs.

Cross-lingual transfer learning: The MLQA dataset can be utilized to develop cross-lingual transfer learning techniques. Models trained on this dataset can learn to perform question-answering tasks in one language and then transfer that knowledge to answer questions in another language.

Language understanding research: Researchers studying natural language processing (NLP) and language understanding can use this dataset to analyze how different languages handle questions and answers within various contexts. They can explore linguistic patterns, variations, and differences across languages by comparing the performance of NLP models trained on this dataset for both similar and dissimilar language pairs

Acknowledgements

If you use this dataset in your research, please credit the original authors.
Data Source

License

License: CC0 1.0 Universal (CC0 1.0) - Public Domain Dedication
No Copyright - You can copy, modify, distribute and perform the work, even for commercial purposes, all without asking permission. See Other Information.

Columns

File: mlqa.es.zh_test.csv

Column name	Description
context	The text passage or paragraph in which a question is being asked. (Text)
answers	The possible answers to the question, along with their start and end positions within the context passage. (Text)

File: mlqa.hi.de_test.csv

Column name	Description
context	The text passage or paragraph in which a question is being asked. (Text)
answers	The possible answers to the question, along with their start and end positions within the context passage. (Text)

File: mlqa.zh.de_test.csv

Column name	Description
context	The text passage or paragraph in which a question is being asked. (Text)
answers	The possible answers to the question, along with their start and end positions within the context passage. (Text)

Acknowledgements

If you use this dataset in your research, please credit the original authors.
If you use this dataset in your research, please credit mlqa (From Huggingface).

Tables

Mlqa Ar Ar Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_ar_test

3.73 MB
5,335 rows
4 columns

CREATE TABLE mlqa_ar_ar_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar Ar Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_ar_validation

354.32 kB
517 rows
4 columns

CREATE TABLE mlqa_ar_ar_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar De Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_de_test

1.03 MB
1,649 rows
4 columns

CREATE TABLE mlqa_ar_de_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar De Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_de_validation

150.16 kB
207 rows
4 columns

CREATE TABLE mlqa_ar_de_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar En Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_en_test

3.68 MB
5,335 rows
4 columns

CREATE TABLE mlqa_ar_en_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar En Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_en_validation

349.97 kB
517 rows
4 columns

CREATE TABLE mlqa_ar_en_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar Es Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_es_test

1.4 MB
1,978 rows
4 columns

CREATE TABLE mlqa_ar_es_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar Es Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_es_validation

115.03 kB
161 rows
4 columns

CREATE TABLE mlqa_ar_es_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar Hi Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_hi_test

1.24 MB
1,831 rows
4 columns

CREATE TABLE mlqa_ar_hi_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar Hi Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_hi_validation

125.55 kB
186 rows
4 columns

CREATE TABLE mlqa_ar_hi_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar Vi Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_vi_test

1.52 MB
2,047 rows
4 columns

CREATE TABLE mlqa_ar_vi_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar Vi Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_vi_validation

140.85 kB
163 rows
4 columns

CREATE TABLE mlqa_ar_vi_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar Zh Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_zh_test

1.45 MB
1,912 rows
4 columns

CREATE TABLE mlqa_ar_zh_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa Ar Zh Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_ar_zh_validation

140.93 kB
188 rows
4 columns

CREATE TABLE mlqa_ar_zh_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De Ar Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_ar_test

910.46 kB
1,649 rows
4 columns

CREATE TABLE mlqa_de_ar_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De Ar Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_ar_validation

114.7 kB
207 rows
4 columns

CREATE TABLE mlqa_de_ar_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De De Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_de_test

2.5 MB
4,517 rows
4 columns

CREATE TABLE mlqa_de_de_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De De Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_de_validation

282.45 kB
512 rows
4 columns

CREATE TABLE mlqa_de_de_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De En Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_en_test

2.48 MB
4,517 rows
4 columns

CREATE TABLE mlqa_de_en_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De En Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_en_validation

280.34 kB
512 rows
4 columns

CREATE TABLE mlqa_de_en_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De Es Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_es_test

978.02 kB
1,776 rows
4 columns

CREATE TABLE mlqa_de_es_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De Es Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_es_validation

112.79 kB
196 rows
4 columns

CREATE TABLE mlqa_de_es_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De Hi Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_hi_test

767.37 kB
1,430 rows
4 columns

CREATE TABLE mlqa_de_hi_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De Hi Validation

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_hi_validation

96.25 kB
163 rows
4 columns

CREATE TABLE mlqa_de_hi_validation (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);

Mlqa De Vi Test

@kaggle.thedevastator_mlqa_multilingual_question_answering_dataset.mlqa_de_vi_test

952.88 kB
1,675 rows
4 columns

CREATE TABLE mlqa_de_vi_test (
  "context" VARCHAR,
  "question" VARCHAR,
  "answers" VARCHAR,
  "id" VARCHAR
);