IR-Datasets Integration<a class="headerlink" href="#ir-datasets-integration" title="Link to this heading">

Corpus version 1.0 with 387 606 arguments crawled from Debatewise, IDebate.org, Debatepedia, Debate.org. It was released on July 9, 2019 on <a href=”https://zenodo.org/record/3274636”>Zenodo</a>. The cleaned version <a class=”ds-ref”>argsme/1.0-cleaned</a> should be preferred. This collection is licensed with the <a href=”https://creativecommons.org/licenses/by/4.0/”>Creative Commons Attribution 4.0 International</a>. Individual rights to the content still apply.

Dataset irds.argsme.1.0.touche-2020-task-1.uncorrected.queries

→ datamaestro_text.datasets.irds.data.AdhocAssessments

Version of <a class=”ds-ref”>argsme/2020-04-01/touche-2020-task-1</a> that uses the <a class=”ds-ref”>argsme/1.0</a> corpus with uncorrected relevance judgements derived from crowdworkers. This dataset’s relevance judgements should not be used without preprocessing. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.argsme.1.0.touche-2020-task-1.uncorrected.qrels

Version of <a class=”ds-ref”>argsme/2020-04-01/touche-2020-task-1</a> that uses the <a class=”ds-ref”>argsme/1.0</a> corpus with uncorrected relevance judgements derived from crowdworkers. This dataset’s relevance judgements should not be used without preprocessing. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.argsme.1.0.touche-2020-task-1.uncorrected

Version of <a class=”ds-ref”>argsme/2020-04-01/touche-2020-task-1</a> that uses the <a class=”ds-ref”>argsme/1.0</a> corpus with uncorrected relevance judgements derived from crowdworkers. This dataset’s relevance judgements should not be used without preprocessing. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

args.me version 1.0 cleaned

Corpus version 1.0-cleaned with 382 545 arguments crawled from Debatewise, IDebate.org, Debatepedia, Debate.org. This version contains the same arguments as <a class=”ds-ref”>argsme/1.0</a>, but was cleaned as described in the corresponding publication. It was released on October 27, 2020 on <a href=”https://zenodo.org/record/4139439”>Zenodo</a>. This collection is licensed with the <a href=”https://creativecommons.org/licenses/by/4.0/”>Creative Commons Attribution 4.0 International</a>. Individual rights to the content still apply.

Dataset irds.argsme.1.0-cleaned.documents

Corpus version 1.0-cleaned with 382 545 arguments crawled from Debatewise, IDebate.org, Debatepedia, Debate.org. This version contains the same arguments as <a class=”ds-ref”>argsme/1.0</a>, but was cleaned as described in the corresponding publication. It was released on October 27, 2020 on <a href=”https://zenodo.org/record/4139439”>Zenodo</a>. This collection is licensed with the <a href=”https://creativecommons.org/licenses/by/4.0/”>Creative Commons Attribution 4.0 International</a>. Individual rights to the content still apply.

argsme/2020-04-01/debateorg

Subset of the 338 620 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from the debate portal Debate.org.

Dataset irds.argsme.2020-04-01.debateorg.documents

Subset of the 338 620 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from the debate portal Debate.org.

argsme/2020-04-01/debatepedia

Subset of the 21 197 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from the debate portal Debatepedia.

Dataset irds.argsme.2020-04-01.debatepedia.documents

Subset of the 21 197 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from the debate portal Debatepedia.

argsme/2020-04-01/debatewise

Subset of the 14 353 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from the debate portal Debatewise.

Dataset irds.argsme.2020-04-01.debatewise.documents

Subset of the 14 353 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from the debate portal Debatewise.

argsme/2020-04-01/idebate

Subset of the 13 522 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from the debate portal IDebate.org.

Dataset irds.argsme.2020-04-01.idebate.documents

Subset of the 13 522 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from the debate portal IDebate.org.

argsme/2020-04-01/parliamentary

Subset of the 48 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from Canadian Parliament discussions.

Dataset irds.argsme.2020-04-01.parliamentary.documents

Subset of the 48 arguments from <a class=”ds-ref”>argsme/2020-04-01</a> that were crawled from Canadian Parliament discussions.

argsme/2020-04-01/processed

Pre-processed version of <a class=”ds-ref”>argsme/2020-04-01</a> where each argument is split into sentences.

Dataset irds.argsme.2020-04-01.processed.documents

Pre-processed version of <a class=”ds-ref”>argsme/2020-04-01</a> where each argument is split into sentences.

Dataset irds.argsme.2020-04-01.processed.touche-2022-task-1.queries

→ datamaestro_text.datasets.irds.data.AdhocAssessments

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a query about a controversial topic, retrieve and rank a relevant pair of sentences from a collection of arguments (<a class=”ds-ref”>argsme/2020-04-01-processed</a>). Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/argument-retrieval-for-controversial-questions.html”>Task 1 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.argsme.2020-04-01.processed.touche-2022-task-1.qrels

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a query about a controversial topic, retrieve and rank a relevant pair of sentences from a collection of arguments (<a class=”ds-ref”>argsme/2020-04-01-processed</a>). Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/argument-retrieval-for-controversial-questions.html”>Task 1 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.argsme.2020-04-01.processed.touche-2022-task-1

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a query about a controversial topic, retrieve and rank a relevant pair of sentences from a collection of arguments (<a class=”ds-ref”>argsme/2020-04-01-processed</a>). Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/argument-retrieval-for-controversial-questions.html”>Task 1 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

args.me

Corpus version 2020-04-01 with 387 740 arguments crawled from Debatewise, IDebate.org, Debatepedia, Debate.org, and from Canadian Parliament discussions. It was released on April 1, 2020 on <a href=”https://zenodo.org/record/3734893”>Zenodo</a>. This collection is licensed with the <a href=”https://creativecommons.org/licenses/by/4.0/”>Creative Commons Attribution 4.0 International</a>. Individual rights to the content still apply.

Dataset irds.argsme.2020-04-01.documents

Corpus version 2020-04-01 with 387 740 arguments crawled from Debatewise, IDebate.org, Debatepedia, Debate.org, and from Canadian Parliament discussions. It was released on April 1, 2020 on <a href=”https://zenodo.org/record/3734893”>Zenodo</a>. This collection is licensed with the <a href=”https://creativecommons.org/licenses/by/4.0/”>Creative Commons Attribution 4.0 International</a>. Individual rights to the content still apply.

Dataset irds.argsme.2020-04-01.touche-2020-task-1.queries

→ datamaestro_text.datasets.irds.data.AdhocAssessments

Decision making processes, be it at the societal or at the personal level, eventually come to a point where one side will challenge the other with a why-question, which is a prompt to justify one’s stance. Thus, technologies for argument mining and argumentation processing are maturing at a rapid pace, giving rise for the first time to argument retrieval. Touché 2020 is the first lab on Argument Retrieval at CLEF 2020 featuring two tasks. Given a question on a controversial topic, retrieve relevant arguments from a focused crawl of online debate portals (<a class=”ds-ref”>argsme/2020-04-01</a>). Documents are judged based on their general topical relevance. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.argsme.2020-04-01.touche-2020-task-1.qrels

Decision making processes, be it at the societal or at the personal level, eventually come to a point where one side will challenge the other with a why-question, which is a prompt to justify one’s stance. Thus, technologies for argument mining and argumentation processing are maturing at a rapid pace, giving rise for the first time to argument retrieval. Touché 2020 is the first lab on Argument Retrieval at CLEF 2020 featuring two tasks. Given a question on a controversial topic, retrieve relevant arguments from a focused crawl of online debate portals (<a class=”ds-ref”>argsme/2020-04-01</a>). Documents are judged based on their general topical relevance. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.argsme.2020-04-01.touche-2020-task-1

Decision making processes, be it at the societal or at the personal level, eventually come to a point where one side will challenge the other with a why-question, which is a prompt to justify one’s stance. Thus, technologies for argument mining and argumentation processing are maturing at a rapid pace, giving rise for the first time to argument retrieval. Touché 2020 is the first lab on Argument Retrieval at CLEF 2020 featuring two tasks. Given a question on a controversial topic, retrieve relevant arguments from a focused crawl of online debate portals (<a class=”ds-ref”>argsme/2020-04-01</a>). Documents are judged based on their general topical relevance. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.argsme.2020-04-01.touche-2021-task-1.queries

→ datamaestro_text.datasets.irds.data.AdhocAssessments

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2021 is the second lab on argument retrieval at CLEF 2021 featuring two tasks. Given a question on a controversial topic, retrieve relevant arguments from a focused crawl of online debate portals (<a class=”ds-ref”>argsme/2020-04-01</a>). Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. <ul> <li><a href=”https://webis.de/events/touche-21/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-21/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-85251-1_28”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI8FDfYnzcjbsf26RIatNgM3”>Workshop videos</a></li> </ul>

Dataset irds.argsme.2020-04-01.touche-2021-task-1.qrels

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2021 is the second lab on argument retrieval at CLEF 2021 featuring two tasks. Given a question on a controversial topic, retrieve relevant arguments from a focused crawl of online debate portals (<a class=”ds-ref”>argsme/2020-04-01</a>). Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. <ul> <li><a href=”https://webis.de/events/touche-21/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-21/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-85251-1_28”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI8FDfYnzcjbsf26RIatNgM3”>Workshop videos</a></li> </ul>

Dataset irds.argsme.2020-04-01.touche-2021-task-1

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2021 is the second lab on argument retrieval at CLEF 2021 featuring two tasks. Given a question on a controversial topic, retrieve relevant arguments from a focused crawl of online debate portals (<a class=”ds-ref”>argsme/2020-04-01</a>). Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. <ul> <li><a href=”https://webis.de/events/touche-21/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-21/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-85251-1_28”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI8FDfYnzcjbsf26RIatNgM3”>Workshop videos</a></li> </ul>

Dataset irds.argsme.2020-04-01.touche-2020-task-1.uncorrected.queries

→ datamaestro_text.datasets.irds.data.AdhocAssessments

Version of <a class=”ds-ref”>argsme/2020-04-01/touche-2020-task-1</a> that uses uncorrected relevance judgements derived from crowdworkers. This dataset’s relevance judgements should not be used without preprocessing. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.argsme.2020-04-01.touche-2020-task-1.uncorrected.qrels

Version of <a class=”ds-ref”>argsme/2020-04-01/touche-2020-task-1</a> that uses uncorrected relevance judgements derived from crowdworkers. This dataset’s relevance judgements should not be used without preprocessing. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.argsme.2020-04-01.touche-2020-task-1.uncorrected

Version of <a class=”ds-ref”>argsme/2020-04-01/touche-2020-task-1</a> that uses uncorrected relevance judgements derived from crowdworkers. This dataset’s relevance judgements should not be used without preprocessing. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-1.html”>Task 1 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

beir/arguana

A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

Dataset irds.beir.arguana.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

Dataset irds.beir.arguana.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

Dataset irds.beir.arguana.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

Dataset irds.beir.arguana: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

beir/climate-fever

A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

Dataset irds.beir.climate-fever.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

Dataset irds.beir.climate-fever.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

Dataset irds.beir.climate-fever.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

Dataset irds.beir.climate-fever: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

beir/cqadupstack/android

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>android</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.android.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>android</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.android.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>android</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.android.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>android</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.android: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>android</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/english

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>english</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.english.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>english</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.english.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>english</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.english.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>english</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.english: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>english</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/gaming

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gaming</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.gaming.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gaming</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.gaming.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gaming</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.gaming.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gaming</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.gaming: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gaming</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/gis

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gis</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.gis.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gis</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.gis.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gis</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.gis.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gis</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.gis: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>gis</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/mathematica

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>mathematica</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.mathematica.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>mathematica</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.mathematica.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>mathematica</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.mathematica.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>mathematica</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.mathematica: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>mathematica</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/physics

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>physics</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.physics.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>physics</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.physics.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>physics</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.physics.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>physics</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.physics: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>physics</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/programmers

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>programmers</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.programmers.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>programmers</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.programmers.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>programmers</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.programmers.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>programmers</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.programmers: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>programmers</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/stats

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>stats</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.stats.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>stats</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.stats.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>stats</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.stats.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>stats</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.stats: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>stats</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/tex

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>tex</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.tex.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>tex</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.tex.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>tex</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.tex.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>tex</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.tex: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>tex</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/unix

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>unix</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.unix.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>unix</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.unix.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>unix</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.unix.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>unix</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.unix: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>unix</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/webmasters

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>webmasters</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.webmasters.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>webmasters</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.webmasters.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>webmasters</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.webmasters.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>webmasters</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.webmasters: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>webmasters</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/cqadupstack/wordpress

A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>wordpress</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.wordpress.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>wordpress</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.wordpress.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>wordpress</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.wordpress.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>wordpress</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

Dataset irds.beir.cqadupstack.wordpress: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CQADupStack dataset, for duplicate question retrieval. This subset is from the <kbd>wordpress</kbd> StackExchange subforum. <ul> <li><a href=”https://people.eng.unimelb.edu.au/tbaldwin/pubs/adcs2015.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cis.unimelb.edu.au/resources/cqadupstack/”>Dataset website</a></li> <li><a href=”https://github.com/D1Doris/CQADupStack”>Dataset repository</a></li> </ul>

beir/dbpedia-entity

A version of the DBPedia-Entity-v2 dataset for entity retrieval. <ul> <li><a href=”http://hasibi.com/files/sigir2017-dbpedia_entity.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/iai-group/DBpedia-Entity”>Dataset website</a></li> </ul>

Dataset irds.beir.dbpedia-entity.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the DBPedia-Entity-v2 dataset for entity retrieval. <ul> <li><a href=”http://hasibi.com/files/sigir2017-dbpedia_entity.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/iai-group/DBpedia-Entity”>Dataset website</a></li> </ul>

Dataset irds.beir.dbpedia-entity.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the DBPedia-Entity-v2 dataset for entity retrieval. <ul> <li><a href=”http://hasibi.com/files/sigir2017-dbpedia_entity.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/iai-group/DBpedia-Entity”>Dataset website</a></li> </ul>

Dataset irds.beir.dbpedia-entity.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 A random sample of 67 queries from the official test set, used as a dev set.

Dataset irds.beir.dbpedia-entity.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A random sample of 67 queries from the official test set, used as a dev set.

Dataset irds.beir.dbpedia-entity.dev: → datamaestro_text.datasets.irds.data.Adhoc

 A random sample of 67 queries from the official test set, used as a dev set.

Dataset irds.beir.dbpedia-entity.test.queries: → datamaestro_text.datasets.irds.data.Topics

 A the official test set, without 67 queries used as a dev set.

Dataset irds.beir.dbpedia-entity.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A the official test set, without 67 queries used as a dev set.

Dataset irds.beir.dbpedia-entity.test: → datamaestro_text.datasets.irds.data.Adhoc

 A the official test set, without 67 queries used as a dev set.

beir/fever

A version of the FEVER dataset for fact verification. Includes queries from the /train /dev and /test subsets. <ul> <li><a href=”https://www.aclweb.org/anthology/N18-1074.pdf”>Dataset paper</a></li> <li><a href=”https://fever.ai/resources.html”>Dataset website</a></li> </ul>

Dataset irds.beir.fever.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the FEVER dataset for fact verification. Includes queries from the /train /dev and /test subsets. <ul> <li><a href=”https://www.aclweb.org/anthology/N18-1074.pdf”>Dataset paper</a></li> <li><a href=”https://fever.ai/resources.html”>Dataset website</a></li> </ul>

Dataset irds.beir.fever.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the FEVER dataset for fact verification. Includes queries from the /train /dev and /test subsets. <ul> <li><a href=”https://www.aclweb.org/anthology/N18-1074.pdf”>Dataset paper</a></li> <li><a href=”https://fever.ai/resources.html”>Dataset website</a></li> </ul>

Dataset irds.beir.fever.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The official dev set.

Dataset irds.beir.fever.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The official dev set.

Dataset irds.beir.fever.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The official dev set.

Dataset irds.beir.fever.test.queries: → datamaestro_text.datasets.irds.data.Topics

 The official test set.

Dataset irds.beir.fever.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The official test set.

Dataset irds.beir.fever.test: → datamaestro_text.datasets.irds.data.Adhoc

 The official test set.

Dataset irds.beir.fever.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The official train set.

Dataset irds.beir.fever.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The official train set.

Dataset irds.beir.fever.train: → datamaestro_text.datasets.irds.data.Adhoc

 The official train set.

beir/fiqa

A version of the FIQA-2018 dataset (financial opinion question answering). Queries include those in the /train /dev and /test subsets. <ul> <li><a href=”https://dl.acm.org/doi/10.1145/3184558.3192301”>Dataset paper</a></li> <li><a href=”https://sites.google.com/view/fiqa/home”>Dataset site</a></li> </ul>

Dataset irds.beir.fiqa.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the FIQA-2018 dataset (financial opinion question answering). Queries include those in the /train /dev and /test subsets. <ul> <li><a href=”https://dl.acm.org/doi/10.1145/3184558.3192301”>Dataset paper</a></li> <li><a href=”https://sites.google.com/view/fiqa/home”>Dataset site</a></li> </ul>

Dataset irds.beir.fiqa.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the FIQA-2018 dataset (financial opinion question answering). Queries include those in the /train /dev and /test subsets. <ul> <li><a href=”https://dl.acm.org/doi/10.1145/3184558.3192301”>Dataset paper</a></li> <li><a href=”https://sites.google.com/view/fiqa/home”>Dataset site</a></li> </ul>

Dataset irds.beir.fiqa.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Random sample of 500 queries from the official dataset.

Dataset irds.beir.fiqa.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Random sample of 500 queries from the official dataset.

Dataset irds.beir.fiqa.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Random sample of 500 queries from the official dataset.

Dataset irds.beir.fiqa.test.queries: → datamaestro_text.datasets.irds.data.Topics

 Random sample of 648 queries from the official dataset.

Dataset irds.beir.fiqa.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Random sample of 648 queries from the official dataset.

Dataset irds.beir.fiqa.test: → datamaestro_text.datasets.irds.data.Adhoc

 Random sample of 648 queries from the official dataset.

Dataset irds.beir.fiqa.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dataset without the 1148 queries sampled for /dev and /test.

Dataset irds.beir.fiqa.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dataset without the 1148 queries sampled for /dev and /test.

Dataset irds.beir.fiqa.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official dataset without the 1148 queries sampled for /dev and /test.

beir/hotpotqa

A version of the Hotpot QA dataset for multi-hop question answering. Queries include all those in /train /dev and /test. <ul> <li><a href=”https://www.aclweb.org/anthology/D18-1259”>Dataset paper</a></li> <li><a href=”https://github.com/hotpotqa/hotpot”>Dataset website</a></li> </ul>

Dataset irds.beir.hotpotqa.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the Hotpot QA dataset for multi-hop question answering. Queries include all those in /train /dev and /test. <ul> <li><a href=”https://www.aclweb.org/anthology/D18-1259”>Dataset paper</a></li> <li><a href=”https://github.com/hotpotqa/hotpot”>Dataset website</a></li> </ul>

Dataset irds.beir.hotpotqa.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the Hotpot QA dataset for multi-hop question answering. Queries include all those in /train /dev and /test. <ul> <li><a href=”https://www.aclweb.org/anthology/D18-1259”>Dataset paper</a></li> <li><a href=”https://github.com/hotpotqa/hotpot”>Dataset website</a></li> </ul>

Dataset irds.beir.hotpotqa.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Random selection of the 5447 queries from /train.

Dataset irds.beir.hotpotqa.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Random selection of the 5447 queries from /train.

Dataset irds.beir.hotpotqa.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Random selection of the 5447 queries from /train.

Dataset irds.beir.hotpotqa.test.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev set from HotpotQA, here used as a test set.

Dataset irds.beir.hotpotqa.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev set from HotpotQA, here used as a test set.

Dataset irds.beir.hotpotqa.test: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev set from HotpotQA, here used as a test set.

Dataset irds.beir.hotpotqa.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set, without the random selection of the 5447 queries used for /dev.

Dataset irds.beir.hotpotqa.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set, without the random selection of the 5447 queries used for /dev.

Dataset irds.beir.hotpotqa.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set, without the random selection of the 5447 queries used for /dev.

beir/msmarco

A version of the MS MARCO passage ranking dataset. Includes queries from the /train, /dev, and /test sub-datasets. Note that this version differs from <a class=”ds-ref”>msmarco-passage</a>, in that it does not correct the encoding problems in the source documents. <ul> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> </ul>

Dataset irds.beir.msmarco.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the MS MARCO passage ranking dataset. Includes queries from the /train, /dev, and /test sub-datasets. Note that this version differs from <a class=”ds-ref”>msmarco-passage</a>, in that it does not correct the encoding problems in the source documents. <ul> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> </ul>

Dataset irds.beir.msmarco.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the MS MARCO passage ranking dataset. Includes queries from the /train, /dev, and /test sub-datasets. Note that this version differs from <a class=”ds-ref”>msmarco-passage</a>, in that it does not correct the encoding problems in the source documents. <ul> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> </ul>

Dataset irds.beir.msmarco.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the MS MARCO passage ranking dev set. <ul> <li>See also: <a class=”ds-ref”>msmarco-passage/dev</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul>

Dataset irds.beir.msmarco.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the MS MARCO passage ranking dev set. <ul> <li>See also: <a class=”ds-ref”>msmarco-passage/dev</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul>

Dataset irds.beir.msmarco.dev: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the MS MARCO passage ranking dev set. <ul> <li>See also: <a class=”ds-ref”>msmarco-passage/dev</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul>

Dataset irds.beir.msmarco.test.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the TREC Deep Learning 2019 set. <ul> <li>See also: <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a></li> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.beir.msmarco.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the TREC Deep Learning 2019 set. <ul> <li>See also: <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a></li> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.beir.msmarco.test: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the TREC Deep Learning 2019 set. <ul> <li>See also: <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a></li> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.beir.msmarco.train.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the MS MARCO passage ranking train set. <ul> <li>See also: <a class=”ds-ref”>msmarco-passage/train</a></li> </ul>

Dataset irds.beir.msmarco.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the MS MARCO passage ranking train set. <ul> <li>See also: <a class=”ds-ref”>msmarco-passage/train</a></li> </ul>

Dataset irds.beir.msmarco.train: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the MS MARCO passage ranking train set. <ul> <li>See also: <a class=”ds-ref”>msmarco-passage/train</a></li> </ul>

beir/nfcorpus

A version of the NF Corpus (Nutrition Facts). Queries use the “title” variant of the query, which here are often natural language questions. Queries include all those from /train /dev and /test. Data pre-processing may be different than what is done in <a class=”ds-ref”>nfcorpus</a>. <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> <li>See also: <a class=”ds-ref”>nfcorpus</a></li> </ul>

Dataset irds.beir.nfcorpus.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the NF Corpus (Nutrition Facts). Queries use the “title” variant of the query, which here are often natural language questions. Queries include all those from /train /dev and /test. Data pre-processing may be different than what is done in <a class=”ds-ref”>nfcorpus</a>. <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> <li>See also: <a class=”ds-ref”>nfcorpus</a></li> </ul>

Dataset irds.beir.nfcorpus.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the NF Corpus (Nutrition Facts). Queries use the “title” variant of the query, which here are often natural language questions. Queries include all those from /train /dev and /test. Data pre-processing may be different than what is done in <a class=”ds-ref”>nfcorpus</a>. <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> <li>See also: <a class=”ds-ref”>nfcorpus</a></li> </ul>

Dataset irds.beir.nfcorpus.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Combined dev set of NFCorpus. <ul> <li>See also: <a class=”ds-ref”>nfcorpus/dev</a></li> </ul>

Dataset irds.beir.nfcorpus.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Combined dev set of NFCorpus. <ul> <li>See also: <a class=”ds-ref”>nfcorpus/dev</a></li> </ul>

Dataset irds.beir.nfcorpus.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Combined dev set of NFCorpus. <ul> <li>See also: <a class=”ds-ref”>nfcorpus/dev</a></li> </ul>

Dataset irds.beir.nfcorpus.test.queries: → datamaestro_text.datasets.irds.data.Topics

 Combined test set of NFCorpus. <ul> <li>See also: <a class=”ds-ref”>nfcorpus/test</a></li> </ul>

Dataset irds.beir.nfcorpus.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Combined test set of NFCorpus. <ul> <li>See also: <a class=”ds-ref”>nfcorpus/test</a></li> </ul>

Dataset irds.beir.nfcorpus.test: → datamaestro_text.datasets.irds.data.Adhoc

 Combined test set of NFCorpus. <ul> <li>See also: <a class=”ds-ref”>nfcorpus/test</a></li> </ul>

Dataset irds.beir.nfcorpus.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Combined train set of NFCorpus. <ul> <li>See also: <a class=”ds-ref”>nfcorpus/train</a></li> </ul>

Dataset irds.beir.nfcorpus.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Combined train set of NFCorpus. <ul> <li>See also: <a class=”ds-ref”>nfcorpus/train</a></li> </ul>

Dataset irds.beir.nfcorpus.train: → datamaestro_text.datasets.irds.data.Adhoc

 Combined train set of NFCorpus. <ul> <li>See also: <a class=”ds-ref”>nfcorpus/train</a></li> </ul>

beir/nq

A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

Dataset irds.beir.nq.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

Dataset irds.beir.nq.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

Dataset irds.beir.nq.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

Dataset irds.beir.nq: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

beir/quora

A version of the Quora duplicate question detection dataset (QQP). Includes queries from /dev and /test sets. <ul> <li><a href=”https://www.kaggle.com/c/quora-question-pairs”>Dataset website</a></li> </ul>

Dataset irds.beir.quora.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the Quora duplicate question detection dataset (QQP). Includes queries from /dev and /test sets. <ul> <li><a href=”https://www.kaggle.com/c/quora-question-pairs”>Dataset website</a></li> </ul>

Dataset irds.beir.quora.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the Quora duplicate question detection dataset (QQP). Includes queries from /dev and /test sets. <ul> <li><a href=”https://www.kaggle.com/c/quora-question-pairs”>Dataset website</a></li> </ul>

Dataset irds.beir.quora.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 A 5,000 question subset of the original dataset, without overlaps in the other subsets.

Dataset irds.beir.quora.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A 5,000 question subset of the original dataset, without overlaps in the other subsets.

Dataset irds.beir.quora.dev: → datamaestro_text.datasets.irds.data.Adhoc

 A 5,000 question subset of the original dataset, without overlaps in the other subsets.

Dataset irds.beir.quora.test.queries: → datamaestro_text.datasets.irds.data.Topics

 A 10,000 question subset of the original dataset, without overlaps in the other subsets.

Dataset irds.beir.quora.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A 10,000 question subset of the original dataset, without overlaps in the other subsets.

Dataset irds.beir.quora.test: → datamaestro_text.datasets.irds.data.Adhoc

 A 10,000 question subset of the original dataset, without overlaps in the other subsets.

beir/scidocs

A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

Dataset irds.beir.scidocs.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

Dataset irds.beir.scidocs.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

Dataset irds.beir.scidocs.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

Dataset irds.beir.scidocs: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

beir/scifact

A version of the SciFact dataset, for fact verification. Queries include those form the /train and /test sets. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset paper</a></li> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset website</a></li> </ul>

Dataset irds.beir.scifact.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the SciFact dataset, for fact verification. Queries include those form the /train and /test sets. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset paper</a></li> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset website</a></li> </ul>

Dataset irds.beir.scifact.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the SciFact dataset, for fact verification. Queries include those form the /train and /test sets. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset paper</a></li> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset website</a></li> </ul>

Dataset irds.beir.scifact.test.queries: → datamaestro_text.datasets.irds.data.Topics

 The official dev set.

Dataset irds.beir.scifact.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The official dev set.

Dataset irds.beir.scifact.test: → datamaestro_text.datasets.irds.data.Adhoc

 The official dev set.

Dataset irds.beir.scifact.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The official train set.

Dataset irds.beir.scifact.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The official train set.

Dataset irds.beir.scifact.train: → datamaestro_text.datasets.irds.data.Adhoc

 The official train set.

beir/trec-covid

A version of the TREC COVID (complete) dataset, with titles and abstracts as documents. Queries are the question variant. Data pre-processing may be different than what is done in <a class=”ds-ref”>cord19/trec-covid</a>. <ul> <li><a href=”https://www.semanticscholar.org/cord19”>Document collection site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>cord19/trec-covid</a></li> </ul>

Dataset irds.beir.trec-covid.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the TREC COVID (complete) dataset, with titles and abstracts as documents. Queries are the question variant. Data pre-processing may be different than what is done in <a class=”ds-ref”>cord19/trec-covid</a>. <ul> <li><a href=”https://www.semanticscholar.org/cord19”>Document collection site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>cord19/trec-covid</a></li> </ul>

Dataset irds.beir.trec-covid.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the TREC COVID (complete) dataset, with titles and abstracts as documents. Queries are the question variant. Data pre-processing may be different than what is done in <a class=”ds-ref”>cord19/trec-covid</a>. <ul> <li><a href=”https://www.semanticscholar.org/cord19”>Document collection site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>cord19/trec-covid</a></li> </ul>

Dataset irds.beir.trec-covid.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the TREC COVID (complete) dataset, with titles and abstracts as documents. Queries are the question variant. Data pre-processing may be different than what is done in <a class=”ds-ref”>cord19/trec-covid</a>. <ul> <li><a href=”https://www.semanticscholar.org/cord19”>Document collection site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>cord19/trec-covid</a></li> </ul>

Dataset irds.beir.trec-covid: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the TREC COVID (complete) dataset, with titles and abstracts as documents. Queries are the question variant. Data pre-processing may be different than what is done in <a class=”ds-ref”>cord19/trec-covid</a>. <ul> <li><a href=”https://www.semanticscholar.org/cord19”>Document collection site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>cord19/trec-covid</a></li> </ul>

beir/webis-touche2020

Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.beir.webis-touche2020.documents: → datamaestro_text.datasets.irds.data.Documents

 Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.beir.webis-touche2020.queries: → datamaestro_text.datasets.irds.data.Topics

 Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.beir.webis-touche2020.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.beir.webis-touche2020: → datamaestro_text.datasets.irds.data.Adhoc

 Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

beir/webis-touche2020/v2

Version 2 of the Touchè-2020 dataset, for argument retrieval. This version uses the “corrected” version of the qrels, mapped to version 1 of the corpus. <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.beir.webis-touche2020.v2.documents: → datamaestro_text.datasets.irds.data.Documents

 Version 2 of the Touchè-2020 dataset, for argument retrieval. This version uses the “corrected” version of the qrels, mapped to version 1 of the corpus. <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.beir.webis-touche2020.v2.queries: → datamaestro_text.datasets.irds.data.Topics

 Version 2 of the Touchè-2020 dataset, for argument retrieval. This version uses the “corrected” version of the qrels, mapped to version 1 of the corpus. <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.beir.webis-touche2020.v2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version 2 of the Touchè-2020 dataset, for argument retrieval. This version uses the “corrected” version of the qrels, mapped to version 1 of the corpus. <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.beir.webis-touche2020.v2: → datamaestro_text.datasets.irds.data.Adhoc

 Version 2 of the Touchè-2020 dataset, for argument retrieval. This version uses the “corrected” version of the qrels, mapped to version 1 of the corpus. <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

c4/en-noclean-tr

The “en-noclean” train subset of the corpus, consisting of ~1B documents written in English. Document IDs are assigned as proposed by the <a href=”https://trec-health-misinfo.github.io/”> TREC Health Misinformation 2021 track</a>.

Dataset irds.c4.en-noclean-tr.documents: → datamaestro_text.datasets.irds.data.Documents

 The “en-noclean” train subset of the corpus, consisting of ~1B documents written in English. Document IDs are assigned as proposed by the <a href=”https://trec-health-misinfo.github.io/”> TREC Health Misinformation 2021 track</a>.

Dataset irds.c4.en-noclean-tr.trec-misinfo-2021.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Health Misinformation 2021 track. <ul> <li><a href=”https://trec-health-misinfo.github.io/”>Shared Task Website</a> </ul>

car/v1.5

Version 1.5 of the TREC dataset. This version is used for year 1 (2017) of the TREC CAR shared task.

Dataset irds.car.v1.5.documents: → datamaestro_text.datasets.irds.data.Documents

 Version 1.5 of the TREC dataset. This version is used for year 1 (2017) of the TREC CAR shared task.

Dataset irds.car.v1.5.test200.queries: → datamaestro_text.datasets.irds.data.Topics

 Un-official test set consisting of manually-selected articles. Sometimes used as a validation set.

Dataset irds.car.v1.5.test200.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Un-official test set consisting of manually-selected articles. Sometimes used as a validation set.

Dataset irds.car.v1.5.test200: → datamaestro_text.datasets.irds.data.Adhoc

 Un-official test set consisting of manually-selected articles. Sometimes used as a validation set.

Dataset irds.car.v1.5.train.fold0.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 0 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold0.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 0 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold0: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 0 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold1.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 1 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 1 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold1: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 1 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold2.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 2 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 2 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold2: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 2 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold3.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 3 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold3.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 3 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold3: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 3 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold4.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 4 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold4.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 4 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.train.fold4: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 4 of the official large training set for TREC CAR 2017. Relevance assumed from hierarchical structure of pages (i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.trec-y1.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test set of TREC CAR 2017 (year 1).

Dataset irds.car.v1.5.trec-y1.auto.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test set of TREC CAR 2017 (year 1), using automatic relevance judgments (assumed from hierarchical structure of pages, i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.trec-y1.auto.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test set of TREC CAR 2017 (year 1), using automatic relevance judgments (assumed from hierarchical structure of pages, i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.trec-y1.auto: → datamaestro_text.datasets.irds.data.Adhoc

 Official test set of TREC CAR 2017 (year 1), using automatic relevance judgments (assumed from hierarchical structure of pages, i.e., paragraphs under a header are assumed relevant.)

Dataset irds.car.v1.5.trec-y1.manual.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test set of TREC CAR 2017 (year 1), using manual graded relevance judgments.

Dataset irds.car.v1.5.trec-y1.manual.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test set of TREC CAR 2017 (year 1), using manual graded relevance judgments.

Dataset irds.car.v1.5.trec-y1.manual: → datamaestro_text.datasets.irds.data.Adhoc

 Official test set of TREC CAR 2017 (year 1), using manual graded relevance judgments.

car/v2.0

Version 2.0 of the TREC CAR dataset.

Dataset irds.car.v2.0.documents: → datamaestro_text.datasets.irds.data.Documents

 Version 2.0 of the TREC CAR dataset.

Highwire (TREC Genomics 2006-07)

Medical document collection from <a href=”https://www.highwirepress.com/”>Highwire Press</a>. Includes 162,259 scientific articles from 49 journals. This dataset is used for the TREC 2006-07 TREC Genomics track. Note that these documents are split into passages based on paragraph tags in the HTML. <ul> <li>Documents: Biomedical journal articles</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2006data.html#docs”>Information about document collection</a></li> </ul>

Dataset irds.highwire.documents: → datamaestro_text.datasets.irds.data.Documents

 Medical document collection from <a href=”https://www.highwirepress.com/”>Highwire Press</a>. Includes 162,259 scientific articles from 49 journals. This dataset is used for the TREC 2006-07 TREC Genomics track. Note that these documents are split into passages based on paragraph tags in the HTML. <ul> <li>Documents: Biomedical journal articles</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2006data.html#docs”>Information about document collection</a></li> </ul>

Dataset irds.highwire.trec-genomics-2006.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Genomics Track 2006 benchmark. Contains 28 queries with passage-level relevance judgments. <ul> <li>Documents: Biomedical journal articles</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, by passage</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2006data.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec15/papers/GEO06.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.highwire.trec-genomics-2006.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Genomics Track 2006 benchmark. Contains 28 queries with passage-level relevance judgments. <ul> <li>Documents: Biomedical journal articles</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, by passage</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2006data.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec15/papers/GEO06.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.highwire.trec-genomics-2006: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Genomics Track 2006 benchmark. Contains 28 queries with passage-level relevance judgments. <ul> <li>Documents: Biomedical journal articles</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, by passage</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2006data.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec15/papers/GEO06.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.highwire.trec-genomics-2007.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Genomics Track 2007 benchmark. Contains 36 queries with passage-level relevance judgments. <ul> <li>Documents: Biomedical journal articles</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, by passage</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2007data.html”>Shared task data site</a></li> <li><a href=”https://dmice.ohsu.edu/hersh/trec-07-genomics.pdf”>Shared task paper</a></li> </ul>

Dataset irds.highwire.trec-genomics-2007.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Genomics Track 2007 benchmark. Contains 36 queries with passage-level relevance judgments. <ul> <li>Documents: Biomedical journal articles</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, by passage</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2007data.html”>Shared task data site</a></li> <li><a href=”https://dmice.ohsu.edu/hersh/trec-07-genomics.pdf”>Shared task paper</a></li> </ul>

Dataset irds.highwire.trec-genomics-2007: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Genomics Track 2007 benchmark. Contains 36 queries with passage-level relevance judgments. <ul> <li>Documents: Biomedical journal articles</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, by passage</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2007data.html”>Shared task data site</a></li> <li><a href=”https://dmice.ohsu.edu/hersh/trec-07-genomics.pdf”>Shared task paper</a></li> </ul>

medline/2004

3M Medline articles including titles and abstracts, used for the TREC 2004-05 Genomics track. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2004data.html”>Information about document collection</a></li> </ul>

Dataset irds.medline.2004.documents: → datamaestro_text.datasets.irds.data.Documents

 3M Medline articles including titles and abstracts, used for the TREC 2004-05 Genomics track. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2004data.html”>Information about document collection</a></li> </ul>

Dataset irds.medline.2004.trec-genomics-2004.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Genomics Track 2004 benchmark. Contains 50 queries with article-level relevance judgments. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, graded</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2004data.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec13/papers/GEO.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2004.trec-genomics-2004.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Genomics Track 2004 benchmark. Contains 50 queries with article-level relevance judgments. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, graded</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2004data.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec13/papers/GEO.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2004.trec-genomics-2004: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Genomics Track 2004 benchmark. Contains 50 queries with article-level relevance judgments. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, graded</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2004data.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec13/papers/GEO.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2004.trec-genomics-2005.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Genomics Track 2005 benchmark. Contains 50 queries with article-level relevance judgments. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, graded</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2005data.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/GEO.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2004.trec-genomics-2005.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Genomics Track 2005 benchmark. Contains 50 queries with article-level relevance judgments. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, graded</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2005data.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/GEO.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2004.trec-genomics-2005: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Genomics Track 2005 benchmark. Contains 50 queries with article-level relevance judgments. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Natural language questions</li> <li>Qrels: deep, graded</li> <li><a href=”https://dmice.ohsu.edu/trec-gen/2005data.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/GEO.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

medline/2017

26M Medline and AACR/ASCO Proceedings articles including titles and abstracts. This collection is used for the TREC 2017-18 TREC Precision Medicine track. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li><a href=”http://www.trec-cds.org/2017.html”>Information about document collection</a></li> </ul>

Dataset irds.medline.2017.documents: → datamaestro_text.datasets.irds.data.Documents

 26M Medline and AACR/ASCO Proceedings articles including titles and abstracts. This collection is used for the TREC 2017-18 TREC Precision Medicine track. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li><a href=”http://www.trec-cds.org/2017.html”>Information about document collection</a></li> </ul>

Dataset irds.medline.2017.trec-pm-2017.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Precision Medicine (PM) Track 2017 benchmark. Contains 30 queries containing disease, gene, and target demographic information. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Specific to TREC PM information need</li> <li>Qrels: deep, graded</li> <li><a href=”http://www.trec-cds.org/2017.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec26/papers/Overview-PM.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2017.trec-pm-2017.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Precision Medicine (PM) Track 2017 benchmark. Contains 30 queries containing disease, gene, and target demographic information. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Specific to TREC PM information need</li> <li>Qrels: deep, graded</li> <li><a href=”http://www.trec-cds.org/2017.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec26/papers/Overview-PM.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2017.trec-pm-2017: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Precision Medicine (PM) Track 2017 benchmark. Contains 30 queries containing disease, gene, and target demographic information. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Specific to TREC PM information need</li> <li>Qrels: deep, graded</li> <li><a href=”http://www.trec-cds.org/2017.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec26/papers/Overview-PM.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2017.trec-pm-2018.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Precision Medicine (PM) Track 2018 benchmark. Contains 50 queries containing disease, gene, and target demographic information. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Specific to TREC PM information need</li> <li>Qrels: deep, graded</li> <li><a href=”http://www.trec-cds.org/2018.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec27/papers/Overview-PM.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2017.trec-pm-2018.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Precision Medicine (PM) Track 2018 benchmark. Contains 50 queries containing disease, gene, and target demographic information. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Specific to TREC PM information need</li> <li>Qrels: deep, graded</li> <li><a href=”http://www.trec-cds.org/2018.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec27/papers/Overview-PM.pdf”>Shared task paper</a></li> </ul>

Dataset irds.medline.2017.trec-pm-2018: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Precision Medicine (PM) Track 2018 benchmark. Contains 50 queries containing disease, gene, and target demographic information. <ul> <li>Documents: Biomedical article titles and abstracts</li> <li>Queries: Specific to TREC PM information need</li> <li>Qrels: deep, graded</li> <li><a href=”http://www.trec-cds.org/2018.html”>Shared task data site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec27/papers/Overview-PM.pdf”>Shared task paper</a></li> </ul>

clinicaltrials/2017

A snapshot of <a href=”https://clinicaltrials.gov/”>ClinicalTrials.gov</a> from April 2017 for use with the <a class=”ds-ref”>clinicaltrials/2017/trec-pm-2017</a> and <a class=”ds-ref”>clinicaltrials/2017/trec-pm-2018</a> Clinical Trials subtasks. <ul> <li><a href=”http://www.trec-cds.org/2017.html#documents”>Dataset information</a></li> </ul>

Dataset irds.clinicaltrials.2017.documents: → datamaestro_text.datasets.irds.data.Documents

 A snapshot of <a href=”https://clinicaltrials.gov/”>ClinicalTrials.gov</a> from April 2017 for use with the <a class=”ds-ref”>clinicaltrials/2017/trec-pm-2017</a> and <a class=”ds-ref”>clinicaltrials/2017/trec-pm-2018</a> Clinical Trials subtasks. <ul> <li><a href=”http://www.trec-cds.org/2017.html#documents”>Dataset information</a></li> </ul>

Dataset irds.clinicaltrials.2017.trec-pm-2017.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC 2017 Precision Medicine clinical trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2017.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec26/papers/Overview-PM.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>medline/2017/trec-pm-2017</a></li> </ul>

Dataset irds.clinicaltrials.2017.trec-pm-2017.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC 2017 Precision Medicine clinical trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2017.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec26/papers/Overview-PM.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>medline/2017/trec-pm-2017</a></li> </ul>

Dataset irds.clinicaltrials.2017.trec-pm-2017: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC 2017 Precision Medicine clinical trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2017.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec26/papers/Overview-PM.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>medline/2017/trec-pm-2017</a></li> </ul>

Dataset irds.clinicaltrials.2017.trec-pm-2018.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC 2018 Precision Medicine clinical trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2018.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec27/papers/Overview-PM.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>medline/2017/trec-pm-2018</a></li> </ul>

Dataset irds.clinicaltrials.2017.trec-pm-2018.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC 2018 Precision Medicine clinical trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2018.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec27/papers/Overview-PM.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>medline/2017/trec-pm-2018</a></li> </ul>

Dataset irds.clinicaltrials.2017.trec-pm-2018: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC 2018 Precision Medicine clinical trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2018.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec27/papers/Overview-PM.pdf”>Shared task paper</a></li> <li>See also: <a class=”ds-ref”>medline/2017/trec-pm-2018</a></li> </ul>

clinicaltrials/2019

A snapshot of <a href=”https://clinicaltrials.gov/”>ClinicalTrials.gov</a> from May 2019 for use with the <a class=”ds-ref”>clinicaltrials/2019/trec-pm-2019</a> Clinical Trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2019.html#documents”>Dataset information</a></li> </ul>

Dataset irds.clinicaltrials.2019.documents: → datamaestro_text.datasets.irds.data.Documents

 A snapshot of <a href=”https://clinicaltrials.gov/”>ClinicalTrials.gov</a> from May 2019 for use with the <a class=”ds-ref”>clinicaltrials/2019/trec-pm-2019</a> Clinical Trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2019.html#documents”>Dataset information</a></li> </ul>

Dataset irds.clinicaltrials.2019.trec-pm-2019.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC 2019 Precision Medicine clinical trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2019.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec28/papers/OVERVIEW.PM.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clinicaltrials.2019.trec-pm-2019.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC 2019 Precision Medicine clinical trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2019.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec28/papers/OVERVIEW.PM.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clinicaltrials.2019.trec-pm-2019: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC 2019 Precision Medicine clinical trials subtask. <ul> <li><a href=”http://www.trec-cds.org/2019.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec28/papers/OVERVIEW.PM.pdf”>Shared task paper</a></li> </ul>

clinicaltrials/2021

A snapshot of <a href=”https://clinicaltrials.gov/”>ClinicalTrials.gov</a> from April 2021 for use with the <a href=”http://www.trec-cds.org/2021.html”>TREC Clinical Trials 2021 Track</a>. <ul> <li><a href=”http://www.trec-cds.org/2021.html#documents”>Dataset information</a></li> </ul>

Dataset irds.clinicaltrials.2021.documents: → datamaestro_text.datasets.irds.data.Documents

 A snapshot of <a href=”https://clinicaltrials.gov/”>ClinicalTrials.gov</a> from April 2021 for use with the <a href=”http://www.trec-cds.org/2021.html”>TREC Clinical Trials 2021 Track</a>. <ul> <li><a href=”http://www.trec-cds.org/2021.html#documents”>Dataset information</a></li> </ul>

Dataset irds.clinicaltrials.2021.trec-ct-2021.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Clinical Trials 2021 track. <ul> <li><a href=”http://www.trec-cds.org/2021.html”>Shared Task Website</a></li> </ul>

Dataset irds.clinicaltrials.2021.trec-ct-2021.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Clinical Trials 2021 track. <ul> <li><a href=”http://www.trec-cds.org/2021.html”>Shared Task Website</a></li> </ul>

Dataset irds.clinicaltrials.2021.trec-ct-2021: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Clinical Trials 2021 track. <ul> <li><a href=”http://www.trec-cds.org/2021.html”>Shared Task Website</a></li> </ul>

Dataset irds.clinicaltrials.2021.trec-ct-2022.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Clinical Trials 2022 track. <ul> <li><a href=”https://www.trec-cds.org/2022.html”>Shared Task Website</a></li> </ul>

ClueWeb09

ClueWeb 2009 web document collection. Contains over 1B web pages, in 10 languages. The dataset is obtained for a fee from CMU, and is shipped as hard drives. More information is provided <a href=”https://lemurproject.org/clueweb09/”>here</a>. <ul> <li><a href=”https://lemurproject.org/clueweb09/”>Document collection site</a></li> </ul>

Dataset irds.clueweb09.documents: → datamaestro_text.datasets.irds.data.Documents

 ClueWeb 2009 web document collection. Contains over 1B web pages, in 10 languages. The dataset is obtained for a fee from CMU, and is shipped as hard drives. More information is provided <a href=”https://lemurproject.org/clueweb09/”>here</a>. <ul> <li><a href=”https://lemurproject.org/clueweb09/”>Document collection site</a></li> </ul>

Dataset irds.clueweb09.trec-mq-2009.queries: → datamaestro_text.datasets.irds.data.Topics

 TREC 2009 Million Query track. <ul> <li><a href=”https://trec.nist.gov/data/million.query09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/MQ09OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.trec-mq-2009.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 TREC 2009 Million Query track. <ul> <li><a href=”https://trec.nist.gov/data/million.query09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/MQ09OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.trec-mq-2009: → datamaestro_text.datasets.irds.data.Adhoc

 TREC 2009 Million Query track. <ul> <li><a href=”https://trec.nist.gov/data/million.query09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/MQ09OVERVIEW.pdf”>Shared task paper</a></li> </ul>

clueweb09/ar

Subset of ClueWeb09 with only Arabic-language documents.

Dataset irds.clueweb09.ar.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only Arabic-language documents.

clueweb09/catb

Subset of ClueWeb09 with the first ~50 million English-language documents. Used as a smaller collection for TREC Web Track tasks.

Dataset irds.clueweb09.catb.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with the first ~50 million English-language documents. Used as a smaller collection for TREC Web Track tasks.

Dataset irds.clueweb09.catb.trec-web-2009.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2009.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2009: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2009.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2009.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2009.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2010.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2010.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2010: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2010.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2010.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2010.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2011.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2011.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2011: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2011.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2011.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2011.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2012.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2012.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2012: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2012.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2012.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.catb.trec-web-2012.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

clueweb09/de

Subset of ClueWeb09 with only German-language documents.

Dataset irds.clueweb09.de.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only German-language documents.

clueweb09/en

Subset of ClueWeb09 with only English-language documents.

Dataset irds.clueweb09.en.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only English-language documents.

Dataset irds.clueweb09.en.trec-web-2009.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2009.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2009: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2009.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2009.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2009.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2009 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web09.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec18/papers/WEB09.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2010.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2010.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2010: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2010.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2010.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2010.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2010 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web10.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2011.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2011.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2011: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2011.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2011.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2011.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2011 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/pubs/trec20/papers/WEB.OVERVIEW.pdf”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2012.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2012.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2012: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2012.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2012.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb09.en.trec-web-2012.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2012 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2012.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec21/papers/WEB12.overview.pdf”>Shared task paper</a></li> </ul>

clueweb09/es

Subset of ClueWeb09 with only Spanish-language documents.

Dataset irds.clueweb09.es.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only Spanish-language documents.

clueweb09/fr

Subset of ClueWeb09 with only French-language documents.

Dataset irds.clueweb09.fr.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only French-language documents.

clueweb09/it

Subset of ClueWeb09 with only Italian-language documents.

Dataset irds.clueweb09.it.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only Italian-language documents.

clueweb09/ja

Subset of ClueWeb09 with only Japanese-language documents.

Dataset irds.clueweb09.ja.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only Japanese-language documents.

clueweb09/ko

Subset of ClueWeb09 with only Korean-language documents.

Dataset irds.clueweb09.ko.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only Korean-language documents.

clueweb09/pt

Subset of ClueWeb09 with only Portuguese-language documents.

Dataset irds.clueweb09.pt.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only Portuguese-language documents.

clueweb09/zh

Subset of ClueWeb09 with only Chinese-language documents.

Dataset irds.clueweb09.zh.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of ClueWeb09 with only Chinese-language documents.

ClueWeb12

ClueWeb 2012 web document collection. Contains 733M web pages. The dataset is obtained for a fee from CMU, and is shipped as hard drives. More information is provided <a href=”https://lemurproject.org/clueweb12/”>here</a>. <ul> <li><a href=”https://lemurproject.org/clueweb12/”>Document collection site</a></li> <li><a href=”http://boston.lti.cs.cmu.edu/clueweb12/”>Dataset construction details</a></li> </ul>

Dataset irds.clueweb12.documents: → datamaestro_text.datasets.irds.data.Documents

 ClueWeb 2012 web document collection. Contains 733M web pages. The dataset is obtained for a fee from CMU, and is shipped as hard drives. More information is provided <a href=”https://lemurproject.org/clueweb12/”>here</a>. <ul> <li><a href=”https://lemurproject.org/clueweb12/”>Document collection site</a></li> <li><a href=”http://boston.lti.cs.cmu.edu/clueweb12/”>Dataset construction details</a></li> </ul>

Dataset irds.clueweb12.trec-web-2013.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2013 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2013.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec22/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2013.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2013 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2013.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec22/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2013: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2013 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2013.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec22/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2013.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2013 diverse ranking benchmark. Contains 50 queries with deep subtopic relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2013.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec22/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2013.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2013 diverse ranking benchmark. Contains 50 queries with deep subtopic relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2013.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec22/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2013.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2013 diverse ranking benchmark. Contains 50 queries with deep subtopic relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2013.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec22/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2014.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2014 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2014.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2014.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2014 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2014.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2014: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2014 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2014.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2014.diversity.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2014 diverse ranking benchmark. Contains 50 queries with deep subtopic relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2014.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2014.diversity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2014 diverse ranking benchmark. Contains 50 queries with deep subtopic relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2014.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.trec-web-2014.diversity: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2014 diverse ranking benchmark. Contains 50 queries with deep subtopic relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/web2014.html”>Shared task site</a></li> <li><a href=”http://www-personal.umich.edu/~kevynct/pubs/trec-web-2014-overview.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.touche-2020-task-2.queries

→ datamaestro_text.datasets.irds.data.AdhocAssessments

Decision making processes, be it at the societal or at the personal level, eventually come to a point where one side will challenge the other with a why-question, which is a prompt to justify one’s stance. Thus, technologies for argument mining and argumentation processing are maturing at a rapid pace, giving rise for the first time to argument retrieval. Touché 2020 is the first lab on Argument Retrieval at CLEF 2020 featuring two tasks. Given a comparative question, retrieve and rank documents from the ClueWeb12 that help to answer the comparative question. Documents are judged based on their general topical relevance. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-2.html”>Task 2 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.clueweb12.touche-2020-task-2.qrels

Decision making processes, be it at the societal or at the personal level, eventually come to a point where one side will challenge the other with a why-question, which is a prompt to justify one’s stance. Thus, technologies for argument mining and argumentation processing are maturing at a rapid pace, giving rise for the first time to argument retrieval. Touché 2020 is the first lab on Argument Retrieval at CLEF 2020 featuring two tasks. Given a comparative question, retrieve and rank documents from the ClueWeb12 that help to answer the comparative question. Documents are judged based on their general topical relevance. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-2.html”>Task 2 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.clueweb12.touche-2020-task-2

Decision making processes, be it at the societal or at the personal level, eventually come to a point where one side will challenge the other with a why-question, which is a prompt to justify one’s stance. Thus, technologies for argument mining and argumentation processing are maturing at a rapid pace, giving rise for the first time to argument retrieval. Touché 2020 is the first lab on Argument Retrieval at CLEF 2020 featuring two tasks. Given a comparative question, retrieve and rank documents from the ClueWeb12 that help to answer the comparative question. Documents are judged based on their general topical relevance. <ul> <li><a href=”https://webis.de/events/touche-20/shared-task-2.html”>Task 2 website</a></li> <li><a href=”https://webis.de/events/touche-20/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-58219-7_26”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI90NnCLg9f4g32KLuOfPXR4”>Workshop videos</a></li> </ul>

Dataset irds.clueweb12.touche-2021-task-2.queries

→ datamaestro_text.datasets.irds.data.AdhocAssessments

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2021 is the second lab on argument retrieval at CLEF 2021 featuring two tasks. Given a comparative question, retrieve and rank documents from the ClueWeb12 that help to answer the comparative question. Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. <ul> <li><a href=”https://webis.de/events/touche-21/shared-task-2.html”>Task 2 website</a></li> <li><a href=”https://webis.de/events/touche-21/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-85251-1_28”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI8FDfYnzcjbsf26RIatNgM3”>Workshop videos</a></li> </ul>

Dataset irds.clueweb12.touche-2021-task-2.qrels

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2021 is the second lab on argument retrieval at CLEF 2021 featuring two tasks. Given a comparative question, retrieve and rank documents from the ClueWeb12 that help to answer the comparative question. Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. <ul> <li><a href=”https://webis.de/events/touche-21/shared-task-2.html”>Task 2 website</a></li> <li><a href=”https://webis.de/events/touche-21/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-85251-1_28”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI8FDfYnzcjbsf26RIatNgM3”>Workshop videos</a></li> </ul>

Dataset irds.clueweb12.touche-2021-task-2

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2021 is the second lab on argument retrieval at CLEF 2021 featuring two tasks. Given a comparative question, retrieve and rank documents from the ClueWeb12 that help to answer the comparative question. Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. <ul> <li><a href=”https://webis.de/events/touche-21/shared-task-2.html”>Task 2 website</a></li> <li><a href=”https://webis.de/events/touche-21/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-85251-1_28”>Overview paper</a></li> <li><a href=”https://www.youtube.com/playlist?list=PLgD1TOdHQCI8FDfYnzcjbsf26RIatNgM3”>Workshop videos</a></li> </ul>

clueweb12/b13

Official subset of the ClueWeb12 datasets with 52M web pages.

Dataset irds.clueweb12.b13.documents: → datamaestro_text.datasets.irds.data.Documents

 Official subset of the ClueWeb12 datasets with 52M web pages.

Dataset irds.clueweb12.b13.clef-ehealth.queries: → datamaestro_text.datasets.irds.data.Topics

 The CLEF eHealth 2016-17 IR dataset. Contains consumer health queries and judgments containing trustworthiness and understandability scores, in addition to the normal relevance assessments. This dataset contains the combined 2016 and 2017 relevance judgments, since the same queries were used in the two year. The assessment year can be distinguished using iteration (2016 is iteration 0, 2017 is iteration 1). <ul> <li><a href=”https://sites.google.com/site/clefehealth2016/task-3”>2016 shared task site</a></li> <li><a href=”https://sites.google.com/site/clefehealth2017/task-3”>2017 shared task site</a></li> <li><a href=”http://ceur-ws.org/Vol-1609/16090015.pdf”>2016 shared task paper</a></li> <li><a href=”http://ceur-ws.org/Vol-1866/invited_paper_16.pdf”>2017 shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.clef-ehealth.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The CLEF eHealth 2016-17 IR dataset. Contains consumer health queries and judgments containing trustworthiness and understandability scores, in addition to the normal relevance assessments. This dataset contains the combined 2016 and 2017 relevance judgments, since the same queries were used in the two year. The assessment year can be distinguished using iteration (2016 is iteration 0, 2017 is iteration 1). <ul> <li><a href=”https://sites.google.com/site/clefehealth2016/task-3”>2016 shared task site</a></li> <li><a href=”https://sites.google.com/site/clefehealth2017/task-3”>2017 shared task site</a></li> <li><a href=”http://ceur-ws.org/Vol-1609/16090015.pdf”>2016 shared task paper</a></li> <li><a href=”http://ceur-ws.org/Vol-1866/invited_paper_16.pdf”>2017 shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.clef-ehealth: → datamaestro_text.datasets.irds.data.Adhoc

 The CLEF eHealth 2016-17 IR dataset. Contains consumer health queries and judgments containing trustworthiness and understandability scores, in addition to the normal relevance assessments. This dataset contains the combined 2016 and 2017 relevance judgments, since the same queries were used in the two year. The assessment year can be distinguished using iteration (2016 is iteration 0, 2017 is iteration 1). <ul> <li><a href=”https://sites.google.com/site/clefehealth2016/task-3”>2016 shared task site</a></li> <li><a href=”https://sites.google.com/site/clefehealth2017/task-3”>2017 shared task site</a></li> <li><a href=”http://ceur-ws.org/Vol-1609/16090015.pdf”>2016 shared task paper</a></li> <li><a href=”http://ceur-ws.org/Vol-1866/invited_paper_16.pdf”>2017 shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.clef-ehealth.cs.queries: → datamaestro_text.datasets.irds.data.Topics

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Czech. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.cs.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Czech. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.cs: → datamaestro_text.datasets.irds.data.Adhoc

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Czech. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.de.queries: → datamaestro_text.datasets.irds.data.Topics

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to German. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.de.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to German. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.de: → datamaestro_text.datasets.irds.data.Adhoc

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to German. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.fr.queries: → datamaestro_text.datasets.irds.data.Topics

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to French. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.fr.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to French. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.fr: → datamaestro_text.datasets.irds.data.Adhoc

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to French. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.hu.queries: → datamaestro_text.datasets.irds.data.Topics

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Hungarian. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.hu.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Hungarian. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.hu: → datamaestro_text.datasets.irds.data.Adhoc

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Hungarian. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.pl.queries: → datamaestro_text.datasets.irds.data.Topics

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Polish. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.pl.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Polish. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.pl: → datamaestro_text.datasets.irds.data.Adhoc

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Polish. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.sv.queries: → datamaestro_text.datasets.irds.data.Topics

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Swedish. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.sv.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Swedish. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.clef-ehealth.sv: → datamaestro_text.datasets.irds.data.Adhoc

 The CLEF eHealth 2016-17 IR dataset, with queries professionally translataed to Swedish. See <a class=”ds-ref”>clueweb12/b13/clef-ehealth</a> for more details.

Dataset irds.clueweb12.b13.ntcir-www-1.queries: → datamaestro_text.datasets.irds.data.Topics

 The NTCIR-13 We Want Web (WWW) 1 ad-hoc ranking benchmark. Contains 100 queries with deep relevance judgments (avg 255 per query). Judgments aggregated from two assessors. Note that the qrels contain additional judgments from the NTCIR-14 CENTRE track. <ul> <li><a href=”http://www.thuir.cn/ntcirwww/”>Shared task site</a></li> <li><a href=”http://www.thuir.cn/ntcirwww/files/ntcir13wwwov.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.ntcir-www-1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The NTCIR-13 We Want Web (WWW) 1 ad-hoc ranking benchmark. Contains 100 queries with deep relevance judgments (avg 255 per query). Judgments aggregated from two assessors. Note that the qrels contain additional judgments from the NTCIR-14 CENTRE track. <ul> <li><a href=”http://www.thuir.cn/ntcirwww/”>Shared task site</a></li> <li><a href=”http://www.thuir.cn/ntcirwww/files/ntcir13wwwov.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.ntcir-www-1: → datamaestro_text.datasets.irds.data.Adhoc

 The NTCIR-13 We Want Web (WWW) 1 ad-hoc ranking benchmark. Contains 100 queries with deep relevance judgments (avg 255 per query). Judgments aggregated from two assessors. Note that the qrels contain additional judgments from the NTCIR-14 CENTRE track. <ul> <li><a href=”http://www.thuir.cn/ntcirwww/”>Shared task site</a></li> <li><a href=”http://www.thuir.cn/ntcirwww/files/ntcir13wwwov.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.ntcir-www-2.queries: → datamaestro_text.datasets.irds.data.Topics

 The NTCIR-14 We Want Web (WWW) 2 ad-hoc ranking benchmark. Contains 80 queries with deep relevance judgments (avg 345 per query). Judgments aggregated from two assessors. <ul> <li><a href=”http://www.thuir.cn/ntcirwww2/”>Shared task site</a></li> <li><a href=”http://research.nii.ac.jp/ntcir/workshop/OnlineProceedings14/pdf/ntcir/01-NTCIR14-OV-WWW-MaoJ.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.ntcir-www-2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The NTCIR-14 We Want Web (WWW) 2 ad-hoc ranking benchmark. Contains 80 queries with deep relevance judgments (avg 345 per query). Judgments aggregated from two assessors. <ul> <li><a href=”http://www.thuir.cn/ntcirwww2/”>Shared task site</a></li> <li><a href=”http://research.nii.ac.jp/ntcir/workshop/OnlineProceedings14/pdf/ntcir/01-NTCIR14-OV-WWW-MaoJ.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.ntcir-www-2: → datamaestro_text.datasets.irds.data.Adhoc

 The NTCIR-14 We Want Web (WWW) 2 ad-hoc ranking benchmark. Contains 80 queries with deep relevance judgments (avg 345 per query). Judgments aggregated from two assessors. <ul> <li><a href=”http://www.thuir.cn/ntcirwww2/”>Shared task site</a></li> <li><a href=”http://research.nii.ac.jp/ntcir/workshop/OnlineProceedings14/pdf/ntcir/01-NTCIR14-OV-WWW-MaoJ.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.ntcir-www-3.queries: → datamaestro_text.datasets.irds.data.Topics

 The NTCIR-15 We Want Web (WWW) 3 ad-hoc ranking benchmark. Contains 160 queries with deep relevance judgments (to be released). 80 of the queries are from <a class=”ds-ref”>clueweb12/b13/ntcir-www-2</a>. <ul> <li><a href=”http://sakailab.com/www3/”>Shared task site</a></li> </ul>

Dataset irds.clueweb12.b13.trec-misinfo-2019.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Medical Misinformation 2019 dataset. <ul> <li><a href=”https://trec.nist.gov/data/misinfo2019.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec28/papers/OVERVIEW.D.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.trec-misinfo-2019.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Medical Misinformation 2019 dataset. <ul> <li><a href=”https://trec.nist.gov/data/misinfo2019.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec28/papers/OVERVIEW.D.pdf”>Shared task paper</a></li> </ul>

Dataset irds.clueweb12.b13.trec-misinfo-2019: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Medical Misinformation 2019 dataset. <ul> <li><a href=”https://trec.nist.gov/data/misinfo2019.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec28/papers/OVERVIEW.D.pdf”>Shared task paper</a></li> </ul>

CODEC

CODEC Document Ranking sub-task. <ul> <li>Documents: curated web articles</li> <li>Queries: challenging, entity-focused queries</li> <li><a href=”https://github.com/grill-lab/CODEC”>Task Repository</a></li> <li>See also: <a class=”ds-ref”>kilt/codec</a>, the entity ranking subtask</li> </ul>

Dataset irds.codec.documents: → datamaestro_text.datasets.irds.data.Documents

 CODEC Document Ranking sub-task. <ul> <li>Documents: curated web articles</li> <li>Queries: challenging, entity-focused queries</li> <li><a href=”https://github.com/grill-lab/CODEC”>Task Repository</a></li> <li>See also: <a class=”ds-ref”>kilt/codec</a>, the entity ranking subtask</li> </ul>

Dataset irds.codec.queries: → datamaestro_text.datasets.irds.data.Topics

 CODEC Document Ranking sub-task. <ul> <li>Documents: curated web articles</li> <li>Queries: challenging, entity-focused queries</li> <li><a href=”https://github.com/grill-lab/CODEC”>Task Repository</a></li> <li>See also: <a class=”ds-ref”>kilt/codec</a>, the entity ranking subtask</li> </ul>

Dataset irds.codec.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 CODEC Document Ranking sub-task. <ul> <li>Documents: curated web articles</li> <li>Queries: challenging, entity-focused queries</li> <li><a href=”https://github.com/grill-lab/CODEC”>Task Repository</a></li> <li>See also: <a class=”ds-ref”>kilt/codec</a>, the entity ranking subtask</li> </ul>

Dataset irds.codec: → datamaestro_text.datasets.irds.data.Adhoc

 CODEC Document Ranking sub-task. <ul> <li>Documents: curated web articles</li> <li>Queries: challenging, entity-focused queries</li> <li><a href=”https://github.com/grill-lab/CODEC”>Task Repository</a></li> <li>See also: <a class=”ds-ref”>kilt/codec</a>, the entity ranking subtask</li> </ul>

Dataset irds.codec.economics.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about economics.

Dataset irds.codec.economics.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about economics.

Dataset irds.codec.economics: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about economics.

Dataset irds.codec.history.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about history.

Dataset irds.codec.history.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about history.

Dataset irds.codec.history: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about history.

Dataset irds.codec.politics.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about politics.

Dataset irds.codec.politics.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about politics.

Dataset irds.codec.politics: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about politics.

CORD-19

Collection of scientific articles related to COVID-19. Uses the 2020-07-16 version of the dataset, corresponding to the “complete” collection used for TREC COVID. Note that this version of the document collection only provides article meta-data. To get the full text, use <a class=”ds-ref”>cord19/fulltext</a>. <ul> <li><a href=”https://www.semanticscholar.org/cord19”>Document collection site</a></li> </ul>

Dataset irds.cord19.documents: → datamaestro_text.datasets.irds.data.Documents

 Collection of scientific articles related to COVID-19. Uses the 2020-07-16 version of the dataset, corresponding to the “complete” collection used for TREC COVID. Note that this version of the document collection only provides article meta-data. To get the full text, use <a class=”ds-ref”>cord19/fulltext</a>. <ul> <li><a href=”https://www.semanticscholar.org/cord19”>Document collection site</a></li> </ul>

Dataset irds.cord19.trec-covid.queries: → datamaestro_text.datasets.irds.data.Topics

 The Complete TREC COVID collection. Queries related to COVID-19, including deep relevance judgments. <ul> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The Complete TREC COVID collection. Queries related to COVID-19, including deep relevance judgments. <ul> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid: → datamaestro_text.datasets.irds.data.Adhoc

 The Complete TREC COVID collection. Queries related to COVID-19, including deep relevance judgments. <ul> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round5.queries: → datamaestro_text.datasets.irds.data.Topics

 Round 5 of the TREC COVID task. Includes 50 queries related to COVID-19. This uses the “2020-07-16” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round5.html”>Round 5 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round5.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Round 5 of the TREC COVID task. Includes 50 queries related to COVID-19. This uses the “2020-07-16” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round5.html”>Round 5 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round5: → datamaestro_text.datasets.irds.data.Adhoc

 Round 5 of the TREC COVID task. Includes 50 queries related to COVID-19. This uses the “2020-07-16” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round5.html”>Round 5 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

cord19/fulltext

Version of <a class=”ds-ref”>cord19</a> dataset that includes article full texts. This dataset takes longer to load than the version that only includes article meata-data.

Dataset irds.cord19.fulltext.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>cord19</a> dataset that includes article full texts. This dataset takes longer to load than the version that only includes article meata-data.

Dataset irds.cord19.fulltext.trec-covid.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>cord19/trec-covid</a> dataset that includes article full texts. This dataset takes longer to load than the version that only includes article meata-data. Queries and qrels are the same as <a class=”ds-ref”>cord19/trec-covid</a>; it just uses the extended documents from <a class=”ds-ref”>cord19/fulltext</a>.

Dataset irds.cord19.fulltext.trec-covid.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>cord19/trec-covid</a> dataset that includes article full texts. This dataset takes longer to load than the version that only includes article meata-data. Queries and qrels are the same as <a class=”ds-ref”>cord19/trec-covid</a>; it just uses the extended documents from <a class=”ds-ref”>cord19/fulltext</a>.

Dataset irds.cord19.fulltext.trec-covid: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>cord19/trec-covid</a> dataset that includes article full texts. This dataset takes longer to load than the version that only includes article meata-data. Queries and qrels are the same as <a class=”ds-ref”>cord19/trec-covid</a>; it just uses the extended documents from <a class=”ds-ref”>cord19/fulltext</a>.

cord19/trec-covid/round1

Round 1 of the TREC COVID task. Includes 30 queries related to COVID-19. This uses the “2020-04-10” version of the collection. <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round1.html”>Round 1 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round1.documents: → datamaestro_text.datasets.irds.data.Documents

 Round 1 of the TREC COVID task. Includes 30 queries related to COVID-19. This uses the “2020-04-10” version of the collection. <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round1.html”>Round 1 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round1.queries: → datamaestro_text.datasets.irds.data.Topics

 Round 1 of the TREC COVID task. Includes 30 queries related to COVID-19. This uses the “2020-04-10” version of the collection. <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round1.html”>Round 1 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Round 1 of the TREC COVID task. Includes 30 queries related to COVID-19. This uses the “2020-04-10” version of the collection. <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round1.html”>Round 1 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round1: → datamaestro_text.datasets.irds.data.Adhoc

 Round 1 of the TREC COVID task. Includes 30 queries related to COVID-19. This uses the “2020-04-10” version of the collection. <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round1.html”>Round 1 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

cord19/trec-covid/round2

Round 2 of the TREC COVID task. Includes 35 queries related to COVID-19. This uses the “2020-05-01” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round2.html”>Round 2 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round2.documents: → datamaestro_text.datasets.irds.data.Documents

 Round 2 of the TREC COVID task. Includes 35 queries related to COVID-19. This uses the “2020-05-01” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round2.html”>Round 2 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round2.queries: → datamaestro_text.datasets.irds.data.Topics

 Round 2 of the TREC COVID task. Includes 35 queries related to COVID-19. This uses the “2020-05-01” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round2.html”>Round 2 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Round 2 of the TREC COVID task. Includes 35 queries related to COVID-19. This uses the “2020-05-01” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round2.html”>Round 2 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round2: → datamaestro_text.datasets.irds.data.Adhoc

 Round 2 of the TREC COVID task. Includes 35 queries related to COVID-19. This uses the “2020-05-01” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round2.html”>Round 2 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

cord19/trec-covid/round3

Round 3 of the TREC COVID task. Includes 40 queries related to COVID-19. This uses the “2020-05-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round3.html”>Round 3 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round3.documents: → datamaestro_text.datasets.irds.data.Documents

 Round 3 of the TREC COVID task. Includes 40 queries related to COVID-19. This uses the “2020-05-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round3.html”>Round 3 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round3.queries: → datamaestro_text.datasets.irds.data.Topics

 Round 3 of the TREC COVID task. Includes 40 queries related to COVID-19. This uses the “2020-05-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round3.html”>Round 3 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round3.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Round 3 of the TREC COVID task. Includes 40 queries related to COVID-19. This uses the “2020-05-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round3.html”>Round 3 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round3: → datamaestro_text.datasets.irds.data.Adhoc

 Round 3 of the TREC COVID task. Includes 40 queries related to COVID-19. This uses the “2020-05-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round3.html”>Round 3 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

cord19/trec-covid/round4

Round 4 of the TREC COVID task. Includes 45 queries related to COVID-19. This uses the “2020-06-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round4.html”>Round 4 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round4.documents: → datamaestro_text.datasets.irds.data.Documents

 Round 4 of the TREC COVID task. Includes 45 queries related to COVID-19. This uses the “2020-06-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round4.html”>Round 4 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round4.queries: → datamaestro_text.datasets.irds.data.Topics

 Round 4 of the TREC COVID task. Includes 45 queries related to COVID-19. This uses the “2020-06-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round4.html”>Round 4 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round4.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Round 4 of the TREC COVID task. Includes 45 queries related to COVID-19. This uses the “2020-06-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round4.html”>Round 4 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Dataset irds.cord19.trec-covid.round4: → datamaestro_text.datasets.irds.data.Adhoc

 Round 4 of the TREC COVID task. Includes 45 queries related to COVID-19. This uses the “2020-06-19” version of the collection. Note that the qrels do not contain results from the prior round(s). Use the “complete” version for this setting (<a class=”ds-ref”>cord19/trec-covid</a>). <ul> <li><a href=”https://ir.nist.gov/covidSubmit/round4.html”>Round 4 Guidelines</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/index.html”>Shared task site</a></li> <li><a href=”https://ir.nist.gov/covidSubmit/papers/Forum_TRECCOVID1.pdf”>Shared task paper</a></li> </ul>

Cranfield

A small corpus of 1,400 scientific abstracts. <ul> <li>Documents: Scientific abstracts</li> <li>Queries: Natural language questions</li> <li><a href=”http://ir.dcs.gla.ac.uk/resources/test_collections/cran/”>Dataset Information</a></li> </ul>

Dataset irds.cranfield.documents: → datamaestro_text.datasets.irds.data.Documents

 A small corpus of 1,400 scientific abstracts. <ul> <li>Documents: Scientific abstracts</li> <li>Queries: Natural language questions</li> <li><a href=”http://ir.dcs.gla.ac.uk/resources/test_collections/cran/”>Dataset Information</a></li> </ul>

Dataset irds.cranfield.queries: → datamaestro_text.datasets.irds.data.Topics

 A small corpus of 1,400 scientific abstracts. <ul> <li>Documents: Scientific abstracts</li> <li>Queries: Natural language questions</li> <li><a href=”http://ir.dcs.gla.ac.uk/resources/test_collections/cran/”>Dataset Information</a></li> </ul>

Dataset irds.cranfield.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A small corpus of 1,400 scientific abstracts. <ul> <li>Documents: Scientific abstracts</li> <li>Queries: Natural language questions</li> <li><a href=”http://ir.dcs.gla.ac.uk/resources/test_collections/cran/”>Dataset Information</a></li> </ul>

Dataset irds.cranfield: → datamaestro_text.datasets.irds.data.Adhoc

 A small corpus of 1,400 scientific abstracts. <ul> <li>Documents: Scientific abstracts</li> <li>Queries: Natural language questions</li> <li><a href=”http://ir.dcs.gla.ac.uk/resources/test_collections/cran/”>Dataset Information</a></li> </ul>

CSL

The CSL dataset, used for the TREC NueCLIR technical document task.

Dataset irds.csl.documents: → datamaestro_text.datasets.irds.data.Documents

 The CSL dataset, used for the TREC NueCLIR technical document task.

Dataset irds.csl.trec-2023.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC NeuCLIR 2023 technical documen task.

Dataset irds.csl.trec-2023.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC NeuCLIR 2023 technical documen task.

Dataset irds.csl.trec-2023: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC NeuCLIR 2023 technical documen task.

disks45/nocr

A version of <a class=”ds-ref”>disks45</a> without the Congressional Record. This is the typical setting for tasks like TREC 7, TREC 8, and TREC Robust 2004.

Dataset irds.disks45.nocr.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of <a class=”ds-ref”>disks45</a> without the Congressional Record. This is the typical setting for tasks like TREC 7, TREC 8, and TREC Robust 2004.

Dataset irds.disks45.nocr.trec-robust-2004.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Robust retrieval task focuses on “improving the consistency of retrieval technology by focusing on poorly performing topics.” The TREC Robust document collection is from TREC disks 4 and 5. Due to the copyrighted nature of the documents, this collection is for research use only, which requires agreements to be filed with NIST. See details <a href=”https://trec.nist.gov/data/cd45/index.html”>here</a>. <ul> <li>Documents: News articles</li> <li>Queries: keyword queries, descriptions, narratives</li> <li>Relevance: Deep judgments</li> <li><a href=”https://trec.nist.gov/pubs/trec13/papers/ROBUST.OVERVIEW.pdf”>Task Overview Paper</a></li> <li>See also: <a class=”ds-ref”>aquaint/trec-robust-2005</a></li> </ul>

Dataset irds.disks45.nocr.trec-robust-2004.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Robust retrieval task focuses on “improving the consistency of retrieval technology by focusing on poorly performing topics.” The TREC Robust document collection is from TREC disks 4 and 5. Due to the copyrighted nature of the documents, this collection is for research use only, which requires agreements to be filed with NIST. See details <a href=”https://trec.nist.gov/data/cd45/index.html”>here</a>. <ul> <li>Documents: News articles</li> <li>Queries: keyword queries, descriptions, narratives</li> <li>Relevance: Deep judgments</li> <li><a href=”https://trec.nist.gov/pubs/trec13/papers/ROBUST.OVERVIEW.pdf”>Task Overview Paper</a></li> <li>See also: <a class=”ds-ref”>aquaint/trec-robust-2005</a></li> </ul>

Dataset irds.disks45.nocr.trec-robust-2004: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Robust retrieval task focuses on “improving the consistency of retrieval technology by focusing on poorly performing topics.” The TREC Robust document collection is from TREC disks 4 and 5. Due to the copyrighted nature of the documents, this collection is for research use only, which requires agreements to be filed with NIST. See details <a href=”https://trec.nist.gov/data/cd45/index.html”>here</a>. <ul> <li>Documents: News articles</li> <li>Queries: keyword queries, descriptions, narratives</li> <li>Relevance: Deep judgments</li> <li><a href=”https://trec.nist.gov/pubs/trec13/papers/ROBUST.OVERVIEW.pdf”>Task Overview Paper</a></li> <li>See also: <a class=”ds-ref”>aquaint/trec-robust-2005</a></li> </ul>

Dataset irds.disks45.nocr.trec-robust-2004.fold1.queries: → datamaestro_text.datasets.irds.data.Topics

Robust04 Fold 1 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Robust04 Fold 1 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold1: → datamaestro_text.datasets.irds.data.Adhoc

Robust04 Fold 1 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold2.queries: → datamaestro_text.datasets.irds.data.Topics

Robust04 Fold 2 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Robust04 Fold 2 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold2: → datamaestro_text.datasets.irds.data.Adhoc

Robust04 Fold 2 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold3.queries: → datamaestro_text.datasets.irds.data.Topics

Robust04 Fold 3 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold3.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Robust04 Fold 3 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold3: → datamaestro_text.datasets.irds.data.Adhoc

Robust04 Fold 3 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold4.queries: → datamaestro_text.datasets.irds.data.Topics

Robust04 Fold 4 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold4.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Robust04 Fold 4 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold4: → datamaestro_text.datasets.irds.data.Adhoc

Robust04 Fold 4 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold5.queries: → datamaestro_text.datasets.irds.data.Topics

Robust04 Fold 5 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold5.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Robust04 Fold 5 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec-robust-2004.fold5: → datamaestro_text.datasets.irds.data.Adhoc

Robust04 Fold 5 (Title) proposed by Huston & Croft (2014) and used in numerous works

Dataset irds.disks45.nocr.trec7.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC 7 Adhoc Retrieval track. <ul> <li><a href=”https://trec.nist.gov/pubs/trec7/papers/overview_7.pdf.gz”>Task Overview Paper</a></li> </ul>

Dataset irds.disks45.nocr.trec7.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC 7 Adhoc Retrieval track. <ul> <li><a href=”https://trec.nist.gov/pubs/trec7/papers/overview_7.pdf.gz”>Task Overview Paper</a></li> </ul>

Dataset irds.disks45.nocr.trec7: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC 7 Adhoc Retrieval track. <ul> <li><a href=”https://trec.nist.gov/pubs/trec7/papers/overview_7.pdf.gz”>Task Overview Paper</a></li> </ul>

Dataset irds.disks45.nocr.trec8.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC 8 Adhoc Retrieval track. <ul> <li><a href=”https://trec.nist.gov/pubs/trec8/papers/overview_8.pdf”>Task Overview Paper</a></li> </ul>

Dataset irds.disks45.nocr.trec8.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC 8 Adhoc Retrieval track. <ul> <li><a href=”https://trec.nist.gov/pubs/trec8/papers/overview_8.pdf”>Task Overview Paper</a></li> </ul>

Dataset irds.disks45.nocr.trec8: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC 8 Adhoc Retrieval track. <ul> <li><a href=”https://trec.nist.gov/pubs/trec8/papers/overview_8.pdf”>Task Overview Paper</a></li> </ul>

DPR Wiki100

A wikipedia dump from 20 December, 2018, split into passages of 100 words. Used in experiments in the DPR paper (and other subsequent works) for retrieval experiments over Q&A collections. <ul> <li><a href=”https://arxiv.org/pdf/2004.04906.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/facebookresearch/DPR”>Repository</a></li> </ul>

Dataset irds.dpr-w100.documents: → datamaestro_text.datasets.irds.data.Documents

 A wikipedia dump from 20 December, 2018, split into passages of 100 words. Used in experiments in the DPR paper (and other subsequent works) for retrieval experiments over Q&A collections. <ul> <li><a href=”https://arxiv.org/pdf/2004.04906.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/facebookresearch/DPR”>Repository</a></li> </ul>

Dataset irds.dpr-w100.natural-questions.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Dev subset from the Natural Questions Q&A collection. This differs from the <a class=”ds-ref”>natural-questions/dev</a> dataset in that it uses the full Wikipedia dump and additional filtering (described in the DPR paper) was applied. <ul> <li>See also: <a class=”ds-ref”>natural-questions</a></li> </ul>

Dataset irds.dpr-w100.natural-questions.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Dev subset from the Natural Questions Q&A collection. This differs from the <a class=”ds-ref”>natural-questions/dev</a> dataset in that it uses the full Wikipedia dump and additional filtering (described in the DPR paper) was applied. <ul> <li>See also: <a class=”ds-ref”>natural-questions</a></li> </ul>

Dataset irds.dpr-w100.natural-questions.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Dev subset from the Natural Questions Q&A collection. This differs from the <a class=”ds-ref”>natural-questions/dev</a> dataset in that it uses the full Wikipedia dump and additional filtering (described in the DPR paper) was applied. <ul> <li>See also: <a class=”ds-ref”>natural-questions</a></li> </ul>

Dataset irds.dpr-w100.natural-questions.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Training subset from the Natural Questions Q&A collection. This differs from the <a class=”ds-ref”>natural-questions/train</a> dataset in that it uses the full Wikipedia dump and additional filtering (described in the DPR paper) was applied. <ul> <li>See also: <a class=”ds-ref”>natural-questions</a></li> </ul>

Dataset irds.dpr-w100.natural-questions.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Training subset from the Natural Questions Q&A collection. This differs from the <a class=”ds-ref”>natural-questions/train</a> dataset in that it uses the full Wikipedia dump and additional filtering (described in the DPR paper) was applied. <ul> <li>See also: <a class=”ds-ref”>natural-questions</a></li> </ul>

Dataset irds.dpr-w100.natural-questions.train: → datamaestro_text.datasets.irds.data.Adhoc

 Training subset from the Natural Questions Q&A collection. This differs from the <a class=”ds-ref”>natural-questions/train</a> dataset in that it uses the full Wikipedia dump and additional filtering (described in the DPR paper) was applied. <ul> <li>See also: <a class=”ds-ref”>natural-questions</a></li> </ul>

Dataset irds.dpr-w100.trivia-qa.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Dev subset from the Trivia QA dataset. Differing from the official Trivia QA collection, this uses the DPR Wikipedia dump as the source collection. Refer to the DPR paper for more details. <ul> <li><a href=”https://www.aclweb.org/anthology/P17-1147.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cs.washington.edu/triviaqa/”>Dataset website</a></li> </ul>

Dataset irds.dpr-w100.trivia-qa.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Dev subset from the Trivia QA dataset. Differing from the official Trivia QA collection, this uses the DPR Wikipedia dump as the source collection. Refer to the DPR paper for more details. <ul> <li><a href=”https://www.aclweb.org/anthology/P17-1147.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cs.washington.edu/triviaqa/”>Dataset website</a></li> </ul>

Dataset irds.dpr-w100.trivia-qa.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Dev subset from the Trivia QA dataset. Differing from the official Trivia QA collection, this uses the DPR Wikipedia dump as the source collection. Refer to the DPR paper for more details. <ul> <li><a href=”https://www.aclweb.org/anthology/P17-1147.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cs.washington.edu/triviaqa/”>Dataset website</a></li> </ul>

Dataset irds.dpr-w100.trivia-qa.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Training subset from the Trivia QA dataset. Differing from the official Trivia QA collection, this uses the DPR Wikipedia dump as the source collection. Refer to the DPR paper for more details. <ul> <li><a href=”https://www.aclweb.org/anthology/P17-1147.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cs.washington.edu/triviaqa/”>Dataset website</a></li> </ul>

Dataset irds.dpr-w100.trivia-qa.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Training subset from the Trivia QA dataset. Differing from the official Trivia QA collection, this uses the DPR Wikipedia dump as the source collection. Refer to the DPR paper for more details. <ul> <li><a href=”https://www.aclweb.org/anthology/P17-1147.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cs.washington.edu/triviaqa/”>Dataset website</a></li> </ul>

Dataset irds.dpr-w100.trivia-qa.train: → datamaestro_text.datasets.irds.data.Adhoc

 Training subset from the Trivia QA dataset. Differing from the official Trivia QA collection, this uses the DPR Wikipedia dump as the source collection. Refer to the DPR paper for more details. <ul> <li><a href=”https://www.aclweb.org/anthology/P17-1147.pdf”>Dataset paper</a></li> <li><a href=”http://nlp.cs.washington.edu/triviaqa/”>Dataset website</a></li> </ul>

CodeSearchNet

A benchmark for semantic code search. Uses <ul> <li>Documents: Code functions in python, java, go, php, ruby, and javascript</li> <li>Queries: Inferred from docstrings, or </li> <li><a href=”https://arxiv.org/pdf/1909.09436.pdf”>Dataset Paper</a></li> <li><a href=”https://wandb.ai/github/codesearchnet/benchmark/leaderboard”>Challenge Task Leaderboard</a></li> </ul>

Dataset irds.codesearchnet.documents: → datamaestro_text.datasets.irds.data.Documents

 A benchmark for semantic code search. Uses <ul> <li>Documents: Code functions in python, java, go, php, ruby, and javascript</li> <li>Queries: Inferred from docstrings, or </li> <li><a href=”https://arxiv.org/pdf/1909.09436.pdf”>Dataset Paper</a></li> <li><a href=”https://wandb.ai/github/codesearchnet/benchmark/leaderboard”>Challenge Task Leaderboard</a></li> </ul>

Dataset irds.codesearchnet.challenge.queries: → datamaestro_text.datasets.irds.data.Topics

 Official challenge set, with keyword queries and deep relevance assessments.

Dataset irds.codesearchnet.challenge.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official challenge set, with keyword queries and deep relevance assessments.

Dataset irds.codesearchnet.challenge: → datamaestro_text.datasets.irds.data.Adhoc

 Official challenge set, with keyword queries and deep relevance assessments.

Dataset irds.codesearchnet.test.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test set, using queries inferred from docstrings.

Dataset irds.codesearchnet.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test set, using queries inferred from docstrings.

Dataset irds.codesearchnet.test: → datamaestro_text.datasets.irds.data.Adhoc

 Official test set, using queries inferred from docstrings.

Dataset irds.codesearchnet.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set, using queries inferred from docstrings.

Dataset irds.codesearchnet.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set, using queries inferred from docstrings.

Dataset irds.codesearchnet.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set, using queries inferred from docstrings.

Dataset irds.codesearchnet.valid.queries: → datamaestro_text.datasets.irds.data.Topics

 Official validation set, using queries inferred from docstrings.

Dataset irds.codesearchnet.valid.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official validation set, using queries inferred from docstrings.

Dataset irds.codesearchnet.valid: → datamaestro_text.datasets.irds.data.Adhoc

 Official validation set, using queries inferred from docstrings.

GOV

GOV web document collection. Used for early TREC Web Tracks. Not to be confused with <a class=”ds-ref”>gov2</a>. The dataset is obtained for a fee from UoG, and is shipped as a hard drive. More information is provided <a href=”http://ir.dcs.gla.ac.uk/test_collections/access_to_data.html”>here</a>. <ul> <li><a href=”http://ir.dcs.gla.ac.uk/test_collections/gov2-summary.htm”>Document collection site</a></li> </ul>

Dataset irds.gov.documents: → datamaestro_text.datasets.irds.data.Documents

 GOV web document collection. Used for early TREC Web Tracks. Not to be confused with <a class=”ds-ref”>gov2</a>. The dataset is obtained for a fee from UoG, and is shipped as a hard drive. More information is provided <a href=”http://ir.dcs.gla.ac.uk/test_collections/access_to_data.html”>here</a>. <ul> <li><a href=”http://ir.dcs.gla.ac.uk/test_collections/gov2-summary.htm”>Document collection site</a></li> </ul>

Dataset irds.gov.trec-web-2002.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2002 ad-hoc ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t11.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec11/papers/WEB.OVER.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2002.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2002 ad-hoc ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t11.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec11/papers/WEB.OVER.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2002: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2002 ad-hoc ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t11.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec11/papers/WEB.OVER.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2002.named-page.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2002 named page ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t11.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec11/papers/WEB.OVER.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2002.named-page.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2002 named page ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t11.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec11/papers/WEB.OVER.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2002.named-page: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2002 named page ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t11.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec11/papers/WEB.OVER.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2003.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2003 ad-hoc ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t12.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec12/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2003.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2003 ad-hoc ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t12.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec12/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2003: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2003 ad-hoc ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t12.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec12/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2003.named-page.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2003 named page ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t12.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec12/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2003.named-page.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2003 named page ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t12.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec12/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2003.named-page: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2003 named page ranking benchmark. <ul> <li><a href=”https://trec.nist.gov/data/t12.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec12/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2004.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Web Track 2004 ad-hoc ranking benchmark. Queries include a combination of topic distillation, homepage finding, and named page finding. <ul> <li><a href=”https://trec.nist.gov/data/t13.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec12/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2004.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Web Track 2004 ad-hoc ranking benchmark. Queries include a combination of topic distillation, homepage finding, and named page finding. <ul> <li><a href=”https://trec.nist.gov/data/t13.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec12/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov.trec-web-2004: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Web Track 2004 ad-hoc ranking benchmark. Queries include a combination of topic distillation, homepage finding, and named page finding. <ul> <li><a href=”https://trec.nist.gov/data/t13.web.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec12/papers/WEB.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

GOV2

GOV2 web document collection. Used for the TREC Terabyte Track. The dataset is obtained for a fee from UoG, and is shipped as a hard drive. More information is provided <a href=”http://ir.dcs.gla.ac.uk/test_collections/access_to_data.html”>here</a>. <ul> <li><a href=”http://ir.dcs.gla.ac.uk/test_collections/gov2-summary.htm”>Document collection site</a></li> </ul>

Dataset irds.gov2.documents: → datamaestro_text.datasets.irds.data.Documents

 GOV2 web document collection. Used for the TREC Terabyte Track. The dataset is obtained for a fee from UoG, and is shipped as a hard drive. More information is provided <a href=”http://ir.dcs.gla.ac.uk/test_collections/access_to_data.html”>here</a>. <ul> <li><a href=”http://ir.dcs.gla.ac.uk/test_collections/gov2-summary.htm”>Document collection site</a></li> </ul>

Dataset irds.gov2.trec-mq-2007.queries: → datamaestro_text.datasets.irds.data.Topics

 TREC 2007 Million Query track. <ul> <li><a href=”https://trec.nist.gov/data/million.query07.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec16/papers/1MQ.OVERVIEW16.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-mq-2007.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 TREC 2007 Million Query track. <ul> <li><a href=”https://trec.nist.gov/data/million.query07.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec16/papers/1MQ.OVERVIEW16.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-mq-2007: → datamaestro_text.datasets.irds.data.Adhoc

 TREC 2007 Million Query track. <ul> <li><a href=”https://trec.nist.gov/data/million.query07.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec16/papers/1MQ.OVERVIEW16.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-mq-2008.queries: → datamaestro_text.datasets.irds.data.Topics

 TREC 2008 Million Query track. <ul> <li><a href=”https://trec.nist.gov/data/million.query08.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec17/papers/MQ.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-mq-2008.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 TREC 2008 Million Query track. <ul> <li><a href=”https://trec.nist.gov/data/million.query08.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec17/papers/MQ.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-mq-2008: → datamaestro_text.datasets.irds.data.Adhoc

 TREC 2008 Million Query track. <ul> <li><a href=”https://trec.nist.gov/data/million.query08.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec17/papers/MQ.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2004.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Terabyte Track 2004 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte04.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec13/papers/TERA.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2004.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Terabyte Track 2004 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte04.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec13/papers/TERA.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2004: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Terabyte Track 2004 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte04.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec13/papers/TERA.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2005.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Terabyte Track 2005 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2005.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Terabyte Track 2005 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2005: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Terabyte Track 2005 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2005.efficiency.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Terabyte Track 2005 efficiency ranking benchmark. Contains 50,000 queries from a search engine, including the 50 topics from <a class=”ds-ref”>gov2/trec-tb-2005</a>. Only the 50 topics have judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2005.efficiency.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Terabyte Track 2005 efficiency ranking benchmark. Contains 50,000 queries from a search engine, including the 50 topics from <a class=”ds-ref”>gov2/trec-tb-2005</a>. Only the 50 topics have judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2005.efficiency: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Terabyte Track 2005 efficiency ranking benchmark. Contains 50,000 queries from a search engine, including the 50 topics from <a class=”ds-ref”>gov2/trec-tb-2005</a>. Only the 50 topics have judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2005.named-page.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Terabyte Track 2005 named page ranking benchmark. Contains 252 queries with titles that resemble bookmark labels. Relevance judgments include near-duplicate pages and other pages that may satisfy the bookmark label. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2005.named-page.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Terabyte Track 2005 named page ranking benchmark. Contains 252 queries with titles that resemble bookmark labels. Relevance judgments include near-duplicate pages and other pages that may satisfy the bookmark label. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2005.named-page: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Terabyte Track 2005 named page ranking benchmark. Contains 252 queries with titles that resemble bookmark labels. Relevance judgments include near-duplicate pages and other pages that may satisfy the bookmark label. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2006.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Terabyte Track 2006 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte06.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec15/papers/TERA06.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2006.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Terabyte Track 2006 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte06.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec15/papers/TERA06.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2006: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Terabyte Track 2006 ad-hoc ranking benchmark. Contains 50 queries with deep relevance judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte06.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec15/papers/TERA06.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2006.efficiency.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Terabyte Track 2006 efficiency ranking benchmark. Contains 100,000 queries from a search engine, including the 50 topics from <a class=”ds-ref”>gov2/trec-tb-2006</a>. Only the 50 topics have judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2006.efficiency.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Terabyte Track 2006 efficiency ranking benchmark. Contains 100,000 queries from a search engine, including the 50 topics from <a class=”ds-ref”>gov2/trec-tb-2006</a>. Only the 50 topics have judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2006.efficiency: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Terabyte Track 2006 efficiency ranking benchmark. Contains 100,000 queries from a search engine, including the 50 topics from <a class=”ds-ref”>gov2/trec-tb-2006</a>. Only the 50 topics have judgments. <ul> <li><a href=”https://trec.nist.gov/data/terabyte05.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec14/papers/TERABYTE.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2006.efficiency.10k.queries: → datamaestro_text.datasets.irds.data.Topics

 Small stream from <a class=”ds-ref”>gov2/trec-tb-2006/efficiency</a>, with 10,000 queries.

Dataset irds.gov2.trec-tb-2006.efficiency.stream1.queries: → datamaestro_text.datasets.irds.data.Topics

 Stream 1 of <a class=”ds-ref”>gov2/trec-tb-2006/efficiency</a> (25,000 queries).

Dataset irds.gov2.trec-tb-2006.efficiency.stream2.queries: → datamaestro_text.datasets.irds.data.Topics

 Stream 2 of <a class=”ds-ref”>gov2/trec-tb-2006/efficiency</a> (25,000 queries).

Dataset irds.gov2.trec-tb-2006.efficiency.stream3.queries: → datamaestro_text.datasets.irds.data.Topics

 Stream 3 of <a class=”ds-ref”>gov2/trec-tb-2006/efficiency</a> (25,000 queries).

Dataset irds.gov2.trec-tb-2006.efficiency.stream3.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Stream 3 of <a class=”ds-ref”>gov2/trec-tb-2006/efficiency</a> (25,000 queries).

Dataset irds.gov2.trec-tb-2006.efficiency.stream3: → datamaestro_text.datasets.irds.data.Adhoc

 Stream 3 of <a class=”ds-ref”>gov2/trec-tb-2006/efficiency</a> (25,000 queries).

Dataset irds.gov2.trec-tb-2006.efficiency.stream4.queries: → datamaestro_text.datasets.irds.data.Topics

 Stream 4 of <a class=”ds-ref”>gov2/trec-tb-2006/efficiency</a> (25,000 queries).

Dataset irds.gov2.trec-tb-2006.named-page.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Terabyte Track 2006 named page ranking benchmark. Contains 181 queries with titles that resemble bookmark labels. Relevance judgments include near-duplicate pages and other pages that may satisfy the bookmark label. <ul> <li><a href=”https://trec.nist.gov/data/terabyte06.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec15/papers/TERA06.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2006.named-page.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Terabyte Track 2006 named page ranking benchmark. Contains 181 queries with titles that resemble bookmark labels. Relevance judgments include near-duplicate pages and other pages that may satisfy the bookmark label. <ul> <li><a href=”https://trec.nist.gov/data/terabyte06.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec15/papers/TERA06.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Dataset irds.gov2.trec-tb-2006.named-page: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Terabyte Track 2006 named page ranking benchmark. Contains 181 queries with titles that resemble bookmark labels. Relevance judgments include near-duplicate pages and other pages that may satisfy the bookmark label. <ul> <li><a href=”https://trec.nist.gov/data/terabyte06.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec15/papers/TERA06.OVERVIEW.pdf”>Shared task paper</a></li> </ul>

Istella22

The Istella22 dataset facilitates comparisions between traditional and neural learning-to-rank by including query and document text along with LTR features (not included in ir_datasets). Note that to use the dataset, you must read and accept the <a href=”https://www.istella.ai/dataset/Istella22-LicenseAgreement.txt”>Istella22 License Agreement</a>. By using the dataset, you agree to be bound by the terms of the license: the Istella dataset is solely for non-commercial use. <ul> <li><a href=”https://dl.acm.org/doi/abs/10.1145/3477495.3531740”>Paper</a></li> <li><a href=”https://istella.ai/data/istella22-dataset/”>Website</a></li> </ul>

Dataset irds.istella22.documents: → datamaestro_text.datasets.irds.data.Documents

 The Istella22 dataset facilitates comparisions between traditional and neural learning-to-rank by including query and document text along with LTR features (not included in ir_datasets). Note that to use the dataset, you must read and accept the <a href=”https://www.istella.ai/dataset/Istella22-LicenseAgreement.txt”>Istella22 License Agreement</a>. By using the dataset, you agree to be bound by the terms of the license: the Istella dataset is solely for non-commercial use. <ul> <li><a href=”https://dl.acm.org/doi/abs/10.1145/3477495.3531740”>Paper</a></li> <li><a href=”https://istella.ai/data/istella22-dataset/”>Website</a></li> </ul>

Dataset irds.istella22.test.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test query set.

Dataset irds.istella22.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test query set.

Dataset irds.istella22.test: → datamaestro_text.datasets.irds.data.Adhoc

 Official test query set.

Dataset irds.istella22.test.fold1.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test query set.

Dataset irds.istella22.test.fold1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test query set.

Dataset irds.istella22.test.fold1: → datamaestro_text.datasets.irds.data.Adhoc

 Official test query set.

Dataset irds.istella22.test.fold2.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test query set.

Dataset irds.istella22.test.fold2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test query set.

Dataset irds.istella22.test.fold2: → datamaestro_text.datasets.irds.data.Adhoc

 Official test query set.

Dataset irds.istella22.test.fold3.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test query set.

Dataset irds.istella22.test.fold3.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test query set.

Dataset irds.istella22.test.fold3: → datamaestro_text.datasets.irds.data.Adhoc

 Official test query set.

Dataset irds.istella22.test.fold4.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test query set.

Dataset irds.istella22.test.fold4.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test query set.

Dataset irds.istella22.test.fold4: → datamaestro_text.datasets.irds.data.Adhoc

 Official test query set.

Dataset irds.istella22.test.fold5.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test query set.

Dataset irds.istella22.test.fold5.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test query set.

Dataset irds.istella22.test.fold5: → datamaestro_text.datasets.irds.data.Adhoc

 Official test query set.

KILT

KILT is a corpus used for various “knowledge intensive language tasks”. <ul> <li>Documents: Wikipedia articles</li> <li><a href=”https://github.com/facebookresearch/KILT”>Repository</a></li> <li><a href=”https://arxiv.org/abs/2009.02252”>Paper</a></li> <li><a href=”https://ai.facebook.com/tools/kilt/”>Leaderboard</a></li> </ul>

Dataset irds.kilt.documents: → datamaestro_text.datasets.irds.data.Documents

 KILT is a corpus used for various “knowledge intensive language tasks”. <ul> <li>Documents: Wikipedia articles</li> <li><a href=”https://github.com/facebookresearch/KILT”>Repository</a></li> <li><a href=”https://arxiv.org/abs/2009.02252”>Paper</a></li> <li><a href=”https://ai.facebook.com/tools/kilt/”>Leaderboard</a></li> </ul>

Dataset irds.kilt.codec.queries: → datamaestro_text.datasets.irds.data.Topics

 CODEC Entity Ranking sub-task. <ul> <li><a href=”https://github.com/grill-lab/CODEC”>Task Repository</a></li> <li>See also: <a class=”ds-ref”>codec</a>, the document ranking subtask</li> </ul>

Dataset irds.kilt.codec.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 CODEC Entity Ranking sub-task. <ul> <li><a href=”https://github.com/grill-lab/CODEC”>Task Repository</a></li> <li>See also: <a class=”ds-ref”>codec</a>, the document ranking subtask</li> </ul>

Dataset irds.kilt.codec: → datamaestro_text.datasets.irds.data.Adhoc

 CODEC Entity Ranking sub-task. <ul> <li><a href=”https://github.com/grill-lab/CODEC”>Task Repository</a></li> <li>See also: <a class=”ds-ref”>codec</a>, the document ranking subtask</li> </ul>

Dataset irds.kilt.codec.economics.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about economics.

Dataset irds.kilt.codec.economics.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about economics.

Dataset irds.kilt.codec.economics: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about economics.

Dataset irds.kilt.codec.history.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about history.

Dataset irds.kilt.codec.history.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about history.

Dataset irds.kilt.codec.history: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about history.

Dataset irds.kilt.codec.politics.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about politics.

Dataset irds.kilt.codec.politics.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about politics.

Dataset irds.kilt.codec.politics: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>codec</a> that only contains topics about politics.

lotte/lifestyle/dev

Answers from lifestyle-focused forums, including bicycles, coffee, crafts, diy, gardening, lifehacks, mechanics, music, outdoors, parenting, pets, sports, and travel.

Dataset irds.lotte.lifestyle.dev.documents: → datamaestro_text.datasets.irds.data.Documents

 Answers from lifestyle-focused forums, including bicycles, coffee, crafts, diy, gardening, lifehacks, mechanics, music, outdoors, parenting, pets, sports, and travel.

Dataset irds.lotte.lifestyle.dev.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/lifestyle/dev</a>.

Dataset irds.lotte.lifestyle.dev.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/lifestyle/dev</a>.

Dataset irds.lotte.lifestyle.dev.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/lifestyle/dev</a>.

Dataset irds.lotte.lifestyle.dev.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/lifestyle/dev</a>.

Dataset irds.lotte.lifestyle.dev.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/lifestyle/dev</a>.

Dataset irds.lotte.lifestyle.dev.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/lifestyle/dev</a>.

lotte/lifestyle/test

Queries and answers from lifestyle-focused forums, including bicycles, coffee, crafts, diy, gardening, lifehacks, mechanics, music, outdoors, parenting, pets, sports, and travel.

Dataset irds.lotte.lifestyle.test.documents: → datamaestro_text.datasets.irds.data.Documents

 Queries and answers from lifestyle-focused forums, including bicycles, coffee, crafts, diy, gardening, lifehacks, mechanics, music, outdoors, parenting, pets, sports, and travel.

Dataset irds.lotte.lifestyle.test.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/lifestyle/test</a>.

Dataset irds.lotte.lifestyle.test.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/lifestyle/test</a>.

Dataset irds.lotte.lifestyle.test.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/lifestyle/test</a>.

Dataset irds.lotte.lifestyle.test.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/lifestyle/test</a>.

Dataset irds.lotte.lifestyle.test.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/lifestyle/test</a>.

Dataset irds.lotte.lifestyle.test.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/lifestyle/test</a>.

lotte/pooled/dev

Combined version of <a class=”ds-ref”>lotte/lifestyle/dev</a>, <a class=”ds-ref”>lotte/recreation/dev</a>, <a class=”ds-ref”>lotte/science/dev</a>, <a class=”ds-ref”>lotte/technology/dev</a>, and <a class=”ds-ref”>lotte/writing/dev</a>.

Dataset irds.lotte.pooled.dev.documents: → datamaestro_text.datasets.irds.data.Documents

 Combined version of <a class=”ds-ref”>lotte/lifestyle/dev</a>, <a class=”ds-ref”>lotte/recreation/dev</a>, <a class=”ds-ref”>lotte/science/dev</a>, <a class=”ds-ref”>lotte/technology/dev</a>, and <a class=”ds-ref”>lotte/writing/dev</a>.

Dataset irds.lotte.pooled.dev.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/pooled/dev</a>.

Dataset irds.lotte.pooled.dev.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/pooled/dev</a>.

Dataset irds.lotte.pooled.dev.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/pooled/dev</a>.

Dataset irds.lotte.pooled.dev.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/pooled/dev</a>.

Dataset irds.lotte.pooled.dev.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/pooled/dev</a>.

Dataset irds.lotte.pooled.dev.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/pooled/dev</a>.

lotte/pooled/test

Combined version of <a class=”ds-ref”>lotte/lifestyle/test</a>, <a class=”ds-ref”>lotte/recreation/test</a>, <a class=”ds-ref”>lotte/science/test</a>, <a class=”ds-ref”>lotte/technology/test</a>, and <a class=”ds-ref”>lotte/writing/test</a>.

Dataset irds.lotte.pooled.test.documents: → datamaestro_text.datasets.irds.data.Documents

 Combined version of <a class=”ds-ref”>lotte/lifestyle/test</a>, <a class=”ds-ref”>lotte/recreation/test</a>, <a class=”ds-ref”>lotte/science/test</a>, <a class=”ds-ref”>lotte/technology/test</a>, and <a class=”ds-ref”>lotte/writing/test</a>.

Dataset irds.lotte.pooled.test.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/pooled/test</a>.

Dataset irds.lotte.pooled.test.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/pooled/test</a>.

Dataset irds.lotte.pooled.test.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/pooled/test</a>.

Dataset irds.lotte.pooled.test.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/pooled/test</a>.

Dataset irds.lotte.pooled.test.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/pooled/test</a>.

Dataset irds.lotte.pooled.test.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/pooled/test</a>.

lotte/recreation/dev

Answers from recreation-focused forums, including anime, boardgames, gaming, movies, photo, rpg, and scifi.

Dataset irds.lotte.recreation.dev.documents: → datamaestro_text.datasets.irds.data.Documents

 Answers from recreation-focused forums, including anime, boardgames, gaming, movies, photo, rpg, and scifi.

Dataset irds.lotte.recreation.dev.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/recreation/dev</a>.

Dataset irds.lotte.recreation.dev.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/recreation/dev</a>.

Dataset irds.lotte.recreation.dev.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/recreation/dev</a>.

Dataset irds.lotte.recreation.dev.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/recreation/dev</a>.

Dataset irds.lotte.recreation.dev.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/recreation/dev</a>.

Dataset irds.lotte.recreation.dev.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/recreation/dev</a>.

lotte/recreation/test

Answers from recreation-focused forums, including anime, boardgames, gaming, movies, photo, rpg, and scifi.

Dataset irds.lotte.recreation.test.documents: → datamaestro_text.datasets.irds.data.Documents

 Answers from recreation-focused forums, including anime, boardgames, gaming, movies, photo, rpg, and scifi.

Dataset irds.lotte.recreation.test.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/recreation/test</a>.

Dataset irds.lotte.recreation.test.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/recreation/test</a>.

Dataset irds.lotte.recreation.test.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/recreation/test</a>.

Dataset irds.lotte.recreation.test.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/recreation/test</a>.

Dataset irds.lotte.recreation.test.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/recreation/test</a>.

Dataset irds.lotte.recreation.test.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/recreation/test</a>.

lotte/science/dev

Answers from science-focused forums, including academia, astronomy, biology, chemistry, datasciene, earthscience, engineering, math, philosophy, physics, and stats.

Dataset irds.lotte.science.dev.documents: → datamaestro_text.datasets.irds.data.Documents

 Answers from science-focused forums, including academia, astronomy, biology, chemistry, datasciene, earthscience, engineering, math, philosophy, physics, and stats.

Dataset irds.lotte.science.dev.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/science/dev</a>.

Dataset irds.lotte.science.dev.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/science/dev</a>.

Dataset irds.lotte.science.dev.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/science/dev</a>.

Dataset irds.lotte.science.dev.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/science/dev</a>.

Dataset irds.lotte.science.dev.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/science/dev</a>.

Dataset irds.lotte.science.dev.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/science/dev</a>.

lotte/science/test

Answers from science-focused forums, including academia, astronomy, biology, chemistry, datasciene, earthscience, engineering, math, philosophy, physics, and stats.

Dataset irds.lotte.science.test.documents: → datamaestro_text.datasets.irds.data.Documents

 Answers from science-focused forums, including academia, astronomy, biology, chemistry, datasciene, earthscience, engineering, math, philosophy, physics, and stats.

Dataset irds.lotte.science.test.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/science/test</a>.

Dataset irds.lotte.science.test.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/science/test</a>.

Dataset irds.lotte.science.test.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/science/test</a>.

Dataset irds.lotte.science.test.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/science/test</a>.

Dataset irds.lotte.science.test.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/science/test</a>.

Dataset irds.lotte.science.test.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/science/test</a>.

lotte/technology/dev

Answers from technology-focused forums, including android, apple, askubuntu, electronics, networkengineering, security, serverfault, softwareengineering, superuser, unix, and webapps.

Dataset irds.lotte.technology.dev.documents: → datamaestro_text.datasets.irds.data.Documents

 Answers from technology-focused forums, including android, apple, askubuntu, electronics, networkengineering, security, serverfault, softwareengineering, superuser, unix, and webapps.

Dataset irds.lotte.technology.dev.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/technology/dev</a>.

Dataset irds.lotte.technology.dev.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/technology/dev</a>.

Dataset irds.lotte.technology.dev.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/technology/dev</a>.

Dataset irds.lotte.technology.dev.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/technology/dev</a>.

Dataset irds.lotte.technology.dev.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/technology/dev</a>.

Dataset irds.lotte.technology.dev.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/technology/dev</a>.

lotte/technology/test

Answers from technology-focused forums, including android, apple, askubuntu, electronics, networkengineering, security, serverfault, softwareengineering, superuser, unix, and webapps.

Dataset irds.lotte.technology.test.documents: → datamaestro_text.datasets.irds.data.Documents

 Answers from technology-focused forums, including android, apple, askubuntu, electronics, networkengineering, security, serverfault, softwareengineering, superuser, unix, and webapps.

Dataset irds.lotte.technology.test.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/technology/test</a>.

Dataset irds.lotte.technology.test.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/technology/test</a>.

Dataset irds.lotte.technology.test.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/technology/test</a>.

Dataset irds.lotte.technology.test.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/technology/test</a>.

Dataset irds.lotte.technology.test.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/technology/test</a>.

Dataset irds.lotte.technology.test.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/technology/test</a>.

lotte/writing/dev

Answers from writing-focused forums, including ell, english, linguistics, literature, worldbuilding, and writing.

Dataset irds.lotte.writing.dev.documents: → datamaestro_text.datasets.irds.data.Documents

 Answers from writing-focused forums, including ell, english, linguistics, literature, worldbuilding, and writing.

Dataset irds.lotte.writing.dev.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/writing/dev</a>.

Dataset irds.lotte.writing.dev.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/writing/dev</a>.

Dataset irds.lotte.writing.dev.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/writing/dev</a>.

Dataset irds.lotte.writing.dev.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/writing/dev</a>.

Dataset irds.lotte.writing.dev.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/writing/dev</a>.

Dataset irds.lotte.writing.dev.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/writing/dev</a>.

lotte/writing/test

Answers from writing-focused forums, including ell, english, linguistics, literature, worldbuilding, and writing.

Dataset irds.lotte.writing.test.documents: → datamaestro_text.datasets.irds.data.Documents

 Answers from writing-focused forums, including ell, english, linguistics, literature, worldbuilding, and writing.

Dataset irds.lotte.writing.test.forum.queries: → datamaestro_text.datasets.irds.data.Topics

 Forum queries for <a class=”ds-ref”>lotte/writing/test</a>.

Dataset irds.lotte.writing.test.forum.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Forum queries for <a class=”ds-ref”>lotte/writing/test</a>.

Dataset irds.lotte.writing.test.forum: → datamaestro_text.datasets.irds.data.Adhoc

 Forum queries for <a class=”ds-ref”>lotte/writing/test</a>.

Dataset irds.lotte.writing.test.search.queries: → datamaestro_text.datasets.irds.data.Topics

 Search queries for <a class=”ds-ref”>lotte/writing/test</a>.

Dataset irds.lotte.writing.test.search.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Search queries for <a class=”ds-ref”>lotte/writing/test</a>.

Dataset irds.lotte.writing.test.search: → datamaestro_text.datasets.irds.data.Adhoc

 Search queries for <a class=”ds-ref”>lotte/writing/test</a>.

miracl/ar

The Arabic corpus.

Dataset irds.miracl.ar.documents: → datamaestro_text.datasets.irds.data.Documents

 The Arabic corpus.

Dataset irds.miracl.ar.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Arabic.

Dataset irds.miracl.ar.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Arabic.

Dataset irds.miracl.ar.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Arabic.

Dataset irds.miracl.ar.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Arabic.

Dataset irds.miracl.ar.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Arabic.

Dataset irds.miracl.ar.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Arabic.

Dataset irds.miracl.ar.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Arabic.

Dataset irds.miracl.ar.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Arabic.

miracl/bn

The Bengali corpus.

Dataset irds.miracl.bn.documents: → datamaestro_text.datasets.irds.data.Documents

 The Bengali corpus.

Dataset irds.miracl.bn.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Bengali.

Dataset irds.miracl.bn.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Bengali.

Dataset irds.miracl.bn.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Bengali.

Dataset irds.miracl.bn.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Bengali.

Dataset irds.miracl.bn.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Bengali.

Dataset irds.miracl.bn.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Bengali.

Dataset irds.miracl.bn.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Bengali.

Dataset irds.miracl.bn.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Bengali.

miracl/de

The German corpus.

Dataset irds.miracl.de.documents: → datamaestro_text.datasets.irds.data.Documents

 The German corpus.

Dataset irds.miracl.de.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for German.

Dataset irds.miracl.de.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for German.

Dataset irds.miracl.de.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for German.

Dataset irds.miracl.de.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for German.

miracl/en

The English corpus.

Dataset irds.miracl.en.documents: → datamaestro_text.datasets.irds.data.Documents

 The English corpus.

Dataset irds.miracl.en.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for English.

Dataset irds.miracl.en.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for English.

Dataset irds.miracl.en.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for English.

Dataset irds.miracl.en.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for English.

Dataset irds.miracl.en.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for English.

Dataset irds.miracl.en.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for English.

Dataset irds.miracl.en.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for English.

Dataset irds.miracl.en.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for English.

miracl/es

The Spanish corpus.

Dataset irds.miracl.es.documents: → datamaestro_text.datasets.irds.data.Documents

 The Spanish corpus.

Dataset irds.miracl.es.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Spanish.

Dataset irds.miracl.es.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Spanish.

Dataset irds.miracl.es.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Spanish.

Dataset irds.miracl.es.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Spanish.

Dataset irds.miracl.es.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Spanish.

Dataset irds.miracl.es.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Spanish.

Dataset irds.miracl.es.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Spanish.

miracl/fa

The Persian corpus.

Dataset irds.miracl.fa.documents: → datamaestro_text.datasets.irds.data.Documents

 The Persian corpus.

Dataset irds.miracl.fa.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Persian.

Dataset irds.miracl.fa.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Persian.

Dataset irds.miracl.fa.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Persian.

Dataset irds.miracl.fa.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Persian.

Dataset irds.miracl.fa.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Persian.

Dataset irds.miracl.fa.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Persian.

Dataset irds.miracl.fa.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Persian.

miracl/fi

The Finnish corpus.

Dataset irds.miracl.fi.documents: → datamaestro_text.datasets.irds.data.Documents

 The Finnish corpus.

Dataset irds.miracl.fi.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Finnish.

Dataset irds.miracl.fi.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Finnish.

Dataset irds.miracl.fi.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Finnish.

Dataset irds.miracl.fi.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Finnish.

Dataset irds.miracl.fi.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Finnish.

Dataset irds.miracl.fi.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Finnish.

Dataset irds.miracl.fi.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Finnish.

Dataset irds.miracl.fi.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Finnish.

miracl/fr

The French corpus.

Dataset irds.miracl.fr.documents: → datamaestro_text.datasets.irds.data.Documents

 The French corpus.

Dataset irds.miracl.fr.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for French.

Dataset irds.miracl.fr.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for French.

Dataset irds.miracl.fr.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for French.

Dataset irds.miracl.fr.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for French.

Dataset irds.miracl.fr.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for French.

Dataset irds.miracl.fr.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for French.

Dataset irds.miracl.fr.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for French.

miracl/hi

The Hindi corpus.

Dataset irds.miracl.hi.documents: → datamaestro_text.datasets.irds.data.Documents

 The Hindi corpus.

Dataset irds.miracl.hi.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Hindi.

Dataset irds.miracl.hi.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Hindi.

Dataset irds.miracl.hi.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Hindi.

Dataset irds.miracl.hi.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Hindi.

Dataset irds.miracl.hi.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Hindi.

Dataset irds.miracl.hi.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Hindi.

Dataset irds.miracl.hi.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Hindi.

miracl/id

The Indonesian corpus.

Dataset irds.miracl.id.documents: → datamaestro_text.datasets.irds.data.Documents

 The Indonesian corpus.

Dataset irds.miracl.id.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Indonesian.

Dataset irds.miracl.id.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Indonesian.

Dataset irds.miracl.id.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Indonesian.

Dataset irds.miracl.id.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Indonesian.

Dataset irds.miracl.id.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Indonesian.

Dataset irds.miracl.id.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Indonesian.

Dataset irds.miracl.id.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Indonesian.

Dataset irds.miracl.id.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Indonesian.

miracl/ja

The Japanese corpus.

Dataset irds.miracl.ja.documents: → datamaestro_text.datasets.irds.data.Documents

 The Japanese corpus.

Dataset irds.miracl.ja.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Japanese.

Dataset irds.miracl.ja.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Japanese.

Dataset irds.miracl.ja.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Japanese.

Dataset irds.miracl.ja.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Japanese.

Dataset irds.miracl.ja.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Japanese.

Dataset irds.miracl.ja.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Japanese.

Dataset irds.miracl.ja.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Japanese.

Dataset irds.miracl.ja.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Japanese.

miracl/ko

The Korean corpus.

Dataset irds.miracl.ko.documents: → datamaestro_text.datasets.irds.data.Documents

 The Korean corpus.

Dataset irds.miracl.ko.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Korean.

Dataset irds.miracl.ko.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Korean.

Dataset irds.miracl.ko.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Korean.

Dataset irds.miracl.ko.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Korean.

Dataset irds.miracl.ko.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Korean.

Dataset irds.miracl.ko.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Korean.

Dataset irds.miracl.ko.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Korean.

Dataset irds.miracl.ko.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Korean.

miracl/ru

The Russian corpus.

Dataset irds.miracl.ru.documents: → datamaestro_text.datasets.irds.data.Documents

 The Russian corpus.

Dataset irds.miracl.ru.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Russian.

Dataset irds.miracl.ru.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Russian.

Dataset irds.miracl.ru.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Russian.

Dataset irds.miracl.ru.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Russian.

Dataset irds.miracl.ru.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Russian.

Dataset irds.miracl.ru.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Russian.

Dataset irds.miracl.ru.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Russian.

Dataset irds.miracl.ru.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Russian.

miracl/sw

The Swahili corpus.

Dataset irds.miracl.sw.documents: → datamaestro_text.datasets.irds.data.Documents

 The Swahili corpus.

Dataset irds.miracl.sw.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Swahili.

Dataset irds.miracl.sw.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Swahili.

Dataset irds.miracl.sw.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Swahili.

Dataset irds.miracl.sw.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Swahili.

Dataset irds.miracl.sw.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Swahili.

Dataset irds.miracl.sw.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Swahili.

Dataset irds.miracl.sw.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Swahili.

Dataset irds.miracl.sw.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Swahili.

miracl/te

The Telugu corpus.

Dataset irds.miracl.te.documents: → datamaestro_text.datasets.irds.data.Documents

 The Telugu corpus.

Dataset irds.miracl.te.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Telugu.

Dataset irds.miracl.te.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Telugu.

Dataset irds.miracl.te.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Telugu.

Dataset irds.miracl.te.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Telugu.

Dataset irds.miracl.te.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Telugu.

Dataset irds.miracl.te.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Telugu.

Dataset irds.miracl.te.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Telugu.

Dataset irds.miracl.te.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Telugu.

miracl/th

The Thai corpus.

Dataset irds.miracl.th.documents: → datamaestro_text.datasets.irds.data.Documents

 The Thai corpus.

Dataset irds.miracl.th.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Thai.

Dataset irds.miracl.th.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Thai.

Dataset irds.miracl.th.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Thai.

Dataset irds.miracl.th.test-a.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version a) for Thai.

Dataset irds.miracl.th.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Thai.

Dataset irds.miracl.th.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Thai.

Dataset irds.miracl.th.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Thai.

Dataset irds.miracl.th.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Thai.

miracl/yo

The Yoruba corpus.

Dataset irds.miracl.yo.documents: → datamaestro_text.datasets.irds.data.Documents

 The Yoruba corpus.

Dataset irds.miracl.yo.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Yoruba.

Dataset irds.miracl.yo.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Yoruba.

Dataset irds.miracl.yo.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Yoruba.

Dataset irds.miracl.yo.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Yoruba.

miracl/zh

The Chinese corpus.

Dataset irds.miracl.zh.documents: → datamaestro_text.datasets.irds.data.Documents

 The Chinese corpus.

Dataset irds.miracl.zh.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 The dev set for Chinese.

Dataset irds.miracl.zh.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The dev set for Chinese.

Dataset irds.miracl.zh.dev: → datamaestro_text.datasets.irds.data.Adhoc

 The dev set for Chinese.

Dataset irds.miracl.zh.test-b.queries: → datamaestro_text.datasets.irds.data.Topics

 The held-out test set (version b) for Chinese.

Dataset irds.miracl.zh.train.queries: → datamaestro_text.datasets.irds.data.Topics

 The train set for Chinese.

Dataset irds.miracl.zh.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The train set for Chinese.

Dataset irds.miracl.zh.train: → datamaestro_text.datasets.irds.data.Adhoc

 The train set for Chinese.

MSMARCO (passage)

A passage ranking benchmark with a collection of 8.8 million passages and question queries. Most relevance judgments are shallow (typically at most 1-2 per query), but the TREC Deep Learning track adds deep judgments. Evaluation typically conducted using MRR@10. Note that the original document source files for this collection contain a double-encoding error that cause strange sequences like “å¬” and “ðºð”. These are automatically corrrected (properly converting previous examples to “公” and “🇺🇸”). <ul> <li>See also: <a class=”ds-ref”>msmarco-document</a></li> <li>Documents: Short passages (from web)</li> <li>Queries: Natural language questions (from query log)</li> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-passage.documents: → datamaestro_text.datasets.irds.data.Documents

 A passage ranking benchmark with a collection of 8.8 million passages and question queries. Most relevance judgments are shallow (typically at most 1-2 per query), but the TREC Deep Learning track adds deep judgments. Evaluation typically conducted using MRR@10. Note that the original document source files for this collection contain a double-encoding error that cause strange sequences like “å¬” and “ðºð”. These are automatically corrrected (properly converting previous examples to “公” and “🇺🇸”). <ul> <li>See also: <a class=”ds-ref”>msmarco-document</a></li> <li>Documents: Short passages (from web)</li> <li>Queries: Natural language questions (from query log)</li> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-passage.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev set. scoreddocs are the top 1000 results from BM25. These are used for the “re-ranking” setting. Note that these are sub-sampled to about 1/8 of the total available dev queries by the MSMARCO authors for faster evaluation. The BM25 scores from scoreddocs are not available (all have a score of 0).

Dataset irds.msmarco-passage.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev set. scoreddocs are the top 1000 results from BM25. These are used for the “re-ranking” setting. Note that these are sub-sampled to about 1/8 of the total available dev queries by the MSMARCO authors for faster evaluation. The BM25 scores from scoreddocs are not available (all have a score of 0).

Dataset irds.msmarco-passage.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev set. scoreddocs are the top 1000 results from BM25. These are used for the “re-ranking” setting. Note that these are sub-sampled to about 1/8 of the total available dev queries by the MSMARCO authors for faster evaluation. The BM25 scores from scoreddocs are not available (all have a score of 0).

Dataset irds.msmarco-passage.dev.2.queries: → datamaestro_text.datasets.irds.data.Topics

 “Dev2” split of the <a class=”ds-ref”>msmarco-passage/dev</a> set. Originally released as part of the v2 corpus.

Dataset irds.msmarco-passage.dev.2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 “Dev2” split of the <a class=”ds-ref”>msmarco-passage/dev</a> set. Originally released as part of the v2 corpus.

Dataset irds.msmarco-passage.dev.2: → datamaestro_text.datasets.irds.data.Adhoc

 “Dev2” split of the <a class=”ds-ref”>msmarco-passage/dev</a> set. Originally released as part of the v2 corpus.

Dataset irds.msmarco-passage.dev.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-passage/dev</a> that only includes queries that have at least one qrel.

Dataset irds.msmarco-passage.dev.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-passage/dev</a> that only includes queries that have at least one qrel.

Dataset irds.msmarco-passage.dev.judged: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-passage/dev</a> that only includes queries that have at least one qrel.

Dataset irds.msmarco-passage.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Official “small” version of the dev set, consisting of 6,980 queries (6.9% of the full dev set).

Dataset irds.msmarco-passage.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official “small” version of the dev set, consisting of 6,980 queries (6.9% of the full dev set).

Dataset irds.msmarco-passage.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official “small” version of the dev set, consisting of 6,980 queries (6.9% of the full dev set).

Dataset irds.msmarco-passage.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Official “small” version of the dev set, consisting of 6,980 queries (6.9% of the full dev set).

Dataset irds.msmarco-passage.eval.queries: → datamaestro_text.datasets.irds.data.Topics

 Official eval set for submission to MS MARCO leaderboard. Relevance judgments are hidden. scoreddocs are the top 1000 results from BM25. These are used for the “re-ranking” setting. Note that these are sub-sampled to about 1/8 of the total available eval queries by the MSMARCO authors for faster evaluation. The BM25 scores from scoreddocs are not available (all have a score of 0).

Dataset irds.msmarco-passage.eval.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Official “small” version of the eval set, consisting of 6,837 queries (6.8% of the full eval set).

Dataset irds.msmarco-passage.eval.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official “small” version of the eval set, consisting of 6,837 queries (6.8% of the full eval set).

Dataset irds.msmarco-passage.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set. Not all queries have relevance judgments. Use <a class=”ds-ref”>msmarco-passage/train/judged</a> for a filtered list that only includes documents that have at least one qrel. scoreddocs are the top 1000 results from BM25. These are used for the “re-ranking” setting. Note that these are sub-sampled to about 1/8 of the total available train queries by the MSMARCO authors for faster evaluation. The BM25 scores from scoreddocs are not available (all have a score of 0). docpairs provides access to the “official” sequence for pairwise training.

Dataset irds.msmarco-passage.train.docpairs: Official train set. Not all queries have relevance judgments. Use <a class=”ds-ref”>msmarco-passage/train/judged</a> for a filtered list that only includes documents that have at least one qrel. scoreddocs are the top 1000 results from BM25. These are used for the “re-ranking” setting. Note that these are sub-sampled to about 1/8 of the total available train queries by the MSMARCO authors for faster evaluation. The BM25 scores from scoreddocs are not available (all have a score of 0). docpairs provides access to the “official” sequence for pairwise training.

Dataset irds.msmarco-passage.train.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official train set. Not all queries have relevance judgments. Use <a class=”ds-ref”>msmarco-passage/train/judged</a> for a filtered list that only includes documents that have at least one qrel. scoreddocs are the top 1000 results from BM25. These are used for the “re-ranking” setting. Note that these are sub-sampled to about 1/8 of the total available train queries by the MSMARCO authors for faster evaluation. The BM25 scores from scoreddocs are not available (all have a score of 0). docpairs provides access to the “official” sequence for pairwise training.

Dataset irds.msmarco-passage.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set. Not all queries have relevance judgments. Use <a class=”ds-ref”>msmarco-passage/train/judged</a> for a filtered list that only includes documents that have at least one qrel. scoreddocs are the top 1000 results from BM25. These are used for the “re-ranking” setting. Note that these are sub-sampled to about 1/8 of the total available train queries by the MSMARCO authors for faster evaluation. The BM25 scores from scoreddocs are not available (all have a score of 0). docpairs provides access to the “official” sequence for pairwise training.

Dataset irds.msmarco-passage.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set. Not all queries have relevance judgments. Use <a class=”ds-ref”>msmarco-passage/train/judged</a> for a filtered list that only includes documents that have at least one qrel. scoreddocs are the top 1000 results from BM25. These are used for the “re-ranking” setting. Note that these are sub-sampled to about 1/8 of the total available train queries by the MSMARCO authors for faster evaluation. The BM25 scores from scoreddocs are not available (all have a score of 0). docpairs provides access to the “official” sequence for pairwise training.

Dataset irds.msmarco-passage.train.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have at least one qrel.

Dataset irds.msmarco-passage.train.judged.docpairs: Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have at least one qrel.

Dataset irds.msmarco-passage.train.judged.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have at least one qrel.

Dataset irds.msmarco-passage.train.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have at least one qrel.

Dataset irds.msmarco-passage.train.judged: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have at least one qrel.

Dataset irds.msmarco-passage.train.medical.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have a layman or expert medical term. Note that this includes about 20% false matches due to terms with multiple senses.

Dataset irds.msmarco-passage.train.medical.docpairs: Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have a layman or expert medical term. Note that this includes about 20% false matches due to terms with multiple senses.

Dataset irds.msmarco-passage.train.medical.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have a layman or expert medical term. Note that this includes about 20% false matches due to terms with multiple senses.

Dataset irds.msmarco-passage.train.medical.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have a layman or expert medical term. Note that this includes about 20% false matches due to terms with multiple senses.

Dataset irds.msmarco-passage.train.medical: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> that only includes queries that have a layman or expert medical term. Note that this includes about 20% false matches due to terms with multiple senses.

Dataset irds.msmarco-passage.train.split200-train.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> without 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.split200-train.docpairs: Subset of <a class=”ds-ref”>msmarco-passage/train</a> without 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.split200-train.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> without 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.split200-train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> without 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.split200-train: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> without 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.split200-valid.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> with only 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.split200-valid.docpairs: Subset of <a class=”ds-ref”>msmarco-passage/train</a> with only 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.split200-valid.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> with only 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.split200-valid.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> with only 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.split200-valid: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-passage/train</a> with only 200 queries that are meant to be used as a small validation set. From various works.

Dataset irds.msmarco-passage.train.triples-small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with the “small” triples file (a 10% sample of the full file). Note that to save on storage space (27GB), the contents of the file are mapped to their corresponding query and document IDs. This process takes a few minutes to run the first time the triples are requested.

Dataset irds.msmarco-passage.train.triples-small.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with the “small” triples file (a 10% sample of the full file). Note that to save on storage space (27GB), the contents of the file are mapped to their corresponding query and document IDs. This process takes a few minutes to run the first time the triples are requested.

Dataset irds.msmarco-passage.train.triples-small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with the “small” triples file (a 10% sample of the full file). Note that to save on storage space (27GB), the contents of the file are mapped to their corresponding query and document IDs. This process takes a few minutes to run the first time the triples are requested.

Dataset irds.msmarco-passage.train.triples-small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with the “small” triples file (a 10% sample of the full file). Note that to save on storage space (27GB), the contents of the file are mapped to their corresponding query and document IDs. This process takes a few minutes to run the first time the triples are requested.

Dataset irds.msmarco-passage.train.triples-small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with the “small” triples file (a 10% sample of the full file). Note that to save on storage space (27GB), the contents of the file are mapped to their corresponding query and document IDs. This process takes a few minutes to run the first time the triples are requested.

Dataset irds.msmarco-passage.train.triples-v2.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with version 2 of the triples file. This version of the triples file includes rows that were accidently missing from version 1 of the file (see discussion <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/commit/4695a71c6c76ce85c07a51c0f12690cab19abbb0”>here</a>). Note that this is sorted by the IDs in the file, so you probably would not want to use it unless you first shuffle it before usage. <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/issues/21”>We opened an issue</a> suggesting that a third version of the file is provided that is shuffled so that the order is consistent across groups using the data, but at this time, no such file exists in an official capacity.

Dataset irds.msmarco-passage.train.triples-v2.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with version 2 of the triples file. This version of the triples file includes rows that were accidently missing from version 1 of the file (see discussion <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/commit/4695a71c6c76ce85c07a51c0f12690cab19abbb0”>here</a>). Note that this is sorted by the IDs in the file, so you probably would not want to use it unless you first shuffle it before usage. <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/issues/21”>We opened an issue</a> suggesting that a third version of the file is provided that is shuffled so that the order is consistent across groups using the data, but at this time, no such file exists in an official capacity.

Dataset irds.msmarco-passage.train.triples-v2.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with version 2 of the triples file. This version of the triples file includes rows that were accidently missing from version 1 of the file (see discussion <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/commit/4695a71c6c76ce85c07a51c0f12690cab19abbb0”>here</a>). Note that this is sorted by the IDs in the file, so you probably would not want to use it unless you first shuffle it before usage. <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/issues/21”>We opened an issue</a> suggesting that a third version of the file is provided that is shuffled so that the order is consistent across groups using the data, but at this time, no such file exists in an official capacity.

Dataset irds.msmarco-passage.train.triples-v2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with version 2 of the triples file. This version of the triples file includes rows that were accidently missing from version 1 of the file (see discussion <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/commit/4695a71c6c76ce85c07a51c0f12690cab19abbb0”>here</a>). Note that this is sorted by the IDs in the file, so you probably would not want to use it unless you first shuffle it before usage. <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/issues/21”>We opened an issue</a> suggesting that a third version of the file is provided that is shuffled so that the order is consistent across groups using the data, but at this time, no such file exists in an official capacity.

Dataset irds.msmarco-passage.train.triples-v2: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, but with version 2 of the triples file. This version of the triples file includes rows that were accidently missing from version 1 of the file (see discussion <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/commit/4695a71c6c76ce85c07a51c0f12690cab19abbb0”>here</a>). Note that this is sorted by the IDs in the file, so you probably would not want to use it unless you first shuffle it before usage. <a href=”https://github.com/microsoft/MSMARCO-Passage-Ranking/issues/21”>We opened an issue</a> suggesting that a third version of the file is provided that is shuffled so that the order is consistent across groups using the data, but at this time, no such file exists in an official capacity.

Dataset irds.msmarco-passage.trec-dl-2019.queries: → datamaestro_text.datasets.irds.data.Topics

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-passage/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-passage/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-2019.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-passage/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-passage/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-2019.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-passage/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-passage/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-2019: → datamaestro_text.datasets.irds.data.Adhoc

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-passage/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-passage/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-2019.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-passage.trec-dl-2019.judged.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-passage.trec-dl-2019.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-passage.trec-dl-2019.judged: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-passage.trec-dl-2020.queries: → datamaestro_text.datasets.irds.data.Topics

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-passage/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-passage/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-2020.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-passage/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-passage/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-2020.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-passage/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-passage/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-2020: → datamaestro_text.datasets.irds.data.Adhoc

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-passage/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-passage/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-2020.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-passage.trec-dl-2020.judged.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-passage.trec-dl-2020.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-passage.trec-dl-2020.judged: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-passage.trec-dl-hard.queries: → datamaestro_text.datasets.irds.data.Topics

 A more challenging subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a> and <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>. <ul> <li><a href=”https://github.com/grill-lab/DL-Hard”>data website</a></li> <li>See Also: <a class=”ds-ref”>msmarco-document/trec-dl-hard</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-hard.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A more challenging subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a> and <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>. <ul> <li><a href=”https://github.com/grill-lab/DL-Hard”>data website</a></li> <li>See Also: <a class=”ds-ref”>msmarco-document/trec-dl-hard</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-hard: → datamaestro_text.datasets.irds.data.Adhoc

 A more challenging subset of <a class=”ds-ref”>msmarco-passage/trec-dl-2019</a> and <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>. <ul> <li><a href=”https://github.com/grill-lab/DL-Hard”>data website</a></li> <li>See Also: <a class=”ds-ref”>msmarco-document/trec-dl-hard</a></li> </ul>

Dataset irds.msmarco-passage.trec-dl-hard.fold1.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 1 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 1 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold1: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 1 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold2.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 2 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 2 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold2: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 2 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold3.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 3 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold3.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 3 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold3: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 3 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold4.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 4 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold4.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 4 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold4: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 4 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold5.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 5 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold5.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 5 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

Dataset irds.msmarco-passage.trec-dl-hard.fold5: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 5 of <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a>

mmarco/de

Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into German.

Dataset irds.mmarco.de.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into German.

Dataset irds.mmarco.de.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into German.

Dataset irds.mmarco.de.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into German.

mmarco/es

Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Spanish.

Dataset irds.mmarco.es.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Spanish.

Dataset irds.mmarco.es.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.es.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Spanish.

mmarco/fr

Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into French.

Dataset irds.mmarco.fr.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into French.

Dataset irds.mmarco.fr.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into French.

Dataset irds.mmarco.fr.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into French.

mmarco/id

Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Indonesian.

Dataset irds.mmarco.id.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Indonesian.

Dataset irds.mmarco.id.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.id.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Indonesian.

mmarco/it

Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Italian.

Dataset irds.mmarco.it.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Italian.

Dataset irds.mmarco.it.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.it.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Italian.

mmarco/pt

Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Portuguese.

Dataset irds.mmarco.pt.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Portuguese.

Dataset irds.mmarco.pt.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.dev.small.v1.1.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.dev.small.v1.1.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.dev.small.v1.1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.dev.small.v1.1: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.dev.v1.1.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.dev.v1.1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.dev.v1.1: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.pt.train.v1.1.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.train.v1.1.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.train.v1.1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

Dataset irds.mmarco.pt.train.v1.1: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>. It also removes some duplicated query IDs.

mmarco/ru

Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Russian.

Dataset irds.mmarco.ru.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Russian.

Dataset irds.mmarco.ru.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.ru.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Russian.

mmarco/v2/ar

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Arabic.

Dataset irds.mmarco.v2.ar.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Arabic.

mmarco/v2/de

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into German.

Dataset irds.mmarco.v2.de.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into German.

mmarco/v2/dt

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Dutch.

Dataset irds.mmarco.v2.dt.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Dutch.

mmarco/v2/es

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Spanish.

Dataset irds.mmarco.v2.es.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Spanish.

mmarco/v2/fr

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into French.

Dataset irds.mmarco.v2.fr.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into French.

mmarco/v2/hi

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Hindi.

Dataset irds.mmarco.v2.hi.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Hindi.

mmarco/v2/id

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Indonesian.

Dataset irds.mmarco.v2.id.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Indonesian.

mmarco/v2/it

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Italian.

Dataset irds.mmarco.v2.it.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Italian.

mmarco/v2/ja

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Japanese.

Dataset irds.mmarco.v2.ja.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Japanese.

mmarco/v2/pt

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese.

Dataset irds.mmarco.v2.pt.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Portuguese.

mmarco/v2/ru

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Russian.

Dataset irds.mmarco.v2.ru.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Russian.

mmarco/v2/vi

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Vietnamese.

Dataset irds.mmarco.v2.vi.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Vietnamese.

mmarco/v2/zh

Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.dev.small.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.v2.zh.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Chinese.

mmarco/zh

Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Chinese.

Dataset irds.mmarco.zh.documents: → datamaestro_text.datasets.irds.data.Documents

 Version of <a class=”ds-ref”>msmarco-passage</a>, with documents translated into Chinese.

Dataset irds.mmarco.zh.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.zh.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.zh.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.zh.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.zh.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.zh.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.zh.dev.small.v1.1.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>.

Dataset irds.mmarco.zh.dev.small.v1.1.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>.

Dataset irds.mmarco.zh.dev.small.v1.1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>.

Dataset irds.mmarco.zh.dev.small.v1.1: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>.

Dataset irds.mmarco.zh.dev.v1.1.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>.

Dataset irds.mmarco.zh.dev.v1.1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>.

Dataset irds.mmarco.zh.dev.v1.1: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/dev</a>, with queries and documents translated into Chinese. Version 1.1 of this file includes manual corrections from the authorss of the translated files. <a href=”https://github.com/unicamp-dl/mMARCO/issues/8#issuecomment-992810293”>See discussion here</a>.

Dataset irds.mmarco.zh.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.zh.train.docpairs: Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.zh.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Chinese.

Dataset irds.mmarco.zh.train: → datamaestro_text.datasets.irds.data.Adhoc

 Version of <a class=”ds-ref”>msmarco-passage/train</a>, with queries and documents translated into Chinese.

mr-tydi/ar

Complete Arabic dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ar.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Arabic dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ar.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Arabic dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ar.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Arabic dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ar: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Arabic dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ar.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Arabic

Dataset irds.mr-tydi.ar.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Arabic

Dataset irds.mr-tydi.ar.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Arabic

Dataset irds.mr-tydi.ar.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Arabic

Dataset irds.mr-tydi.ar.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Arabic

Dataset irds.mr-tydi.ar.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Arabic

Dataset irds.mr-tydi.ar.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Arabic

Dataset irds.mr-tydi.ar.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Arabic

Dataset irds.mr-tydi.ar.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Arabic

mr-tydi/bn

Complete Bengali dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.bn.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Bengali dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.bn.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Bengali dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.bn.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Bengali dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.bn: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Bengali dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.bn.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Bengali

Dataset irds.mr-tydi.bn.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Bengali

Dataset irds.mr-tydi.bn.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Bengali

Dataset irds.mr-tydi.bn.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Bengali

Dataset irds.mr-tydi.bn.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Bengali

Dataset irds.mr-tydi.bn.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Bengali

Dataset irds.mr-tydi.bn.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Bengali

Dataset irds.mr-tydi.bn.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Bengali

Dataset irds.mr-tydi.bn.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Bengali

mr-tydi/en

Complete English dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.en.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete English dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.en.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete English dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.en.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete English dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.en: → datamaestro_text.datasets.irds.data.Adhoc

 Complete English dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.en.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for English

Dataset irds.mr-tydi.en.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for English

Dataset irds.mr-tydi.en.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for English

Dataset irds.mr-tydi.en.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for English

Dataset irds.mr-tydi.en.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for English

Dataset irds.mr-tydi.en.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for English

Dataset irds.mr-tydi.en.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for English

Dataset irds.mr-tydi.en.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for English

Dataset irds.mr-tydi.en.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for English

mr-tydi/fi

Complete Finnish dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.fi.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Finnish dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.fi.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Finnish dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.fi.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Finnish dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.fi: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Finnish dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.fi.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Finnish

Dataset irds.mr-tydi.fi.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Finnish

Dataset irds.mr-tydi.fi.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Finnish

Dataset irds.mr-tydi.fi.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Finnish

Dataset irds.mr-tydi.fi.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Finnish

Dataset irds.mr-tydi.fi.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Finnish

Dataset irds.mr-tydi.fi.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Finnish

Dataset irds.mr-tydi.fi.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Finnish

Dataset irds.mr-tydi.fi.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Finnish

mr-tydi/id

Complete Indonesian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.id.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Indonesian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.id.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Indonesian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.id.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Indonesian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.id: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Indonesian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.id.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Indonesian

Dataset irds.mr-tydi.id.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Indonesian

Dataset irds.mr-tydi.id.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Indonesian

Dataset irds.mr-tydi.id.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Indonesian

Dataset irds.mr-tydi.id.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Indonesian

Dataset irds.mr-tydi.id.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Indonesian

Dataset irds.mr-tydi.id.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Indonesian

Dataset irds.mr-tydi.id.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Indonesian

Dataset irds.mr-tydi.id.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Indonesian

mr-tydi/ja

Complete Japanese dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ja.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Japanese dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ja.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Japanese dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ja.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Japanese dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ja: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Japanese dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ja.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Japanese

Dataset irds.mr-tydi.ja.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Japanese

Dataset irds.mr-tydi.ja.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Japanese

Dataset irds.mr-tydi.ja.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Japanese

Dataset irds.mr-tydi.ja.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Japanese

Dataset irds.mr-tydi.ja.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Japanese

Dataset irds.mr-tydi.ja.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Japanese

Dataset irds.mr-tydi.ja.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Japanese

Dataset irds.mr-tydi.ja.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Japanese

mr-tydi/ko

Complete Korean dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ko.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Korean dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ko.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Korean dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ko.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Korean dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ko: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Korean dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ko.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Korean

Dataset irds.mr-tydi.ko.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Korean

Dataset irds.mr-tydi.ko.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Korean

Dataset irds.mr-tydi.ko.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Korean

Dataset irds.mr-tydi.ko.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Korean

Dataset irds.mr-tydi.ko.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Korean

Dataset irds.mr-tydi.ko.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Korean

Dataset irds.mr-tydi.ko.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Korean

Dataset irds.mr-tydi.ko.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Korean

mr-tydi/ru

Complete Russian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ru.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Russian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ru.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Russian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ru.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Russian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ru: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Russian dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.ru.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Russian

Dataset irds.mr-tydi.ru.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Russian

Dataset irds.mr-tydi.ru.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Russian

Dataset irds.mr-tydi.ru.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Russian

Dataset irds.mr-tydi.ru.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Russian

Dataset irds.mr-tydi.ru.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Russian

Dataset irds.mr-tydi.ru.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Russian

Dataset irds.mr-tydi.ru.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Russian

Dataset irds.mr-tydi.ru.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Russian

mr-tydi/sw

Complete Swahili dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.sw.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Swahili dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.sw.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Swahili dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.sw.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Swahili dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.sw: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Swahili dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.sw.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Swahili

Dataset irds.mr-tydi.sw.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Swahili

Dataset irds.mr-tydi.sw.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Swahili

Dataset irds.mr-tydi.sw.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Swahili

Dataset irds.mr-tydi.sw.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Swahili

Dataset irds.mr-tydi.sw.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Swahili

Dataset irds.mr-tydi.sw.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Swahili

Dataset irds.mr-tydi.sw.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Swahili

Dataset irds.mr-tydi.sw.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Swahili

mr-tydi/te

Complete Telugu dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.te.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Telugu dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.te.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Telugu dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.te.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Telugu dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.te: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Telugu dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.te.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Telugu

Dataset irds.mr-tydi.te.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Telugu

Dataset irds.mr-tydi.te.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Telugu

Dataset irds.mr-tydi.te.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Telugu

Dataset irds.mr-tydi.te.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Telugu

Dataset irds.mr-tydi.te.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Telugu

Dataset irds.mr-tydi.te.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Telugu

Dataset irds.mr-tydi.te.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Telugu

Dataset irds.mr-tydi.te.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Telugu

mr-tydi/th

Complete Thai dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.th.documents: → datamaestro_text.datasets.irds.data.Documents

 Complete Thai dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.th.queries: → datamaestro_text.datasets.irds.data.Topics

 Complete Thai dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.th.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Complete Thai dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.th: → datamaestro_text.datasets.irds.data.Adhoc

 Complete Thai dataset, including all train, dev, and test queries and qrels.

Dataset irds.mr-tydi.th.dev.queries: → datamaestro_text.datasets.irds.data.Topics

Development set for Thai

Dataset irds.mr-tydi.th.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Development set for Thai

Dataset irds.mr-tydi.th.dev: → datamaestro_text.datasets.irds.data.Adhoc

Development set for Thai

Dataset irds.mr-tydi.th.test.queries: → datamaestro_text.datasets.irds.data.Topics

Test set for Thai

Dataset irds.mr-tydi.th.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Test set for Thai

Dataset irds.mr-tydi.th.test: → datamaestro_text.datasets.irds.data.Adhoc

Test set for Thai

Dataset irds.mr-tydi.th.train.queries: → datamaestro_text.datasets.irds.data.Topics

Train set for Thai

Dataset irds.mr-tydi.th.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

Train set for Thai

Dataset irds.mr-tydi.th.train: → datamaestro_text.datasets.irds.data.Adhoc

Train set for Thai

MSMARCO (document)

“Based the questions in the [MS-MARCO] Question Answering Dataset and the documents which answered the questions a document ranking task was formulated. There are 3.2 million documents and the goal is to rank based on their relevance. Relevance labels are derived from what passages was marked as having the answer in the QnA dataset.” <ul> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> <li>Documents: Text extracted from web pages</li> <li>Queries: Natural language questions (from query log)</li> <li><a href=”https://microsoft.github.io/msmarco/#docranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-document.documents: → datamaestro_text.datasets.irds.data.Documents

 “Based the questions in the [MS-MARCO] Question Answering Dataset and the documents which answered the questions a document ranking task was formulated. There are 3.2 million documents and the goal is to rank based on their relevance. Relevance labels are derived from what passages was marked as having the answer in the QnA dataset.” <ul> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> <li>Documents: Text extracted from web pages</li> <li>Queries: Natural language questions (from query log)</li> <li><a href=”https://microsoft.github.io/msmarco/#docranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-document.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev set. All queries have exactly 1 (positive) relevance judgment. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.dev.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official dev set. All queries have exactly 1 (positive) relevance judgment. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev set. All queries have exactly 1 (positive) relevance judgment. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev set. All queries have exactly 1 (positive) relevance judgment. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.eval.queries: → datamaestro_text.datasets.irds.data.Topics

 Official eval set for submission to MS MARCO leaderboard. Relevance judgments are hidden. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.eval.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official eval set for submission to MS MARCO leaderboard. Relevance judgments are hidden. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.orcas.queries: → datamaestro_text.datasets.irds.data.Topics

 “ORCAS is a click-based dataset associated with the TREC Deep Learning Track. It covers 1.4 million of the TREC DL documents, providing 18 million connections to 10 million distinct queries.” <ul> <li>Queries: From query log</li> <li>Relevance Data: User clicks</li> <li>Scored docs: Indri Query Likelihood model</li> <li><a href=”https://arxiv.org/abs/2006.05324”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-document.orcas.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 “ORCAS is a click-based dataset associated with the TREC Deep Learning Track. It covers 1.4 million of the TREC DL documents, providing 18 million connections to 10 million distinct queries.” <ul> <li>Queries: From query log</li> <li>Relevance Data: User clicks</li> <li>Scored docs: Indri Query Likelihood model</li> <li><a href=”https://arxiv.org/abs/2006.05324”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-document.orcas.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 “ORCAS is a click-based dataset associated with the TREC Deep Learning Track. It covers 1.4 million of the TREC DL documents, providing 18 million connections to 10 million distinct queries.” <ul> <li>Queries: From query log</li> <li>Relevance Data: User clicks</li> <li>Scored docs: Indri Query Likelihood model</li> <li><a href=”https://arxiv.org/abs/2006.05324”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-document.orcas: → datamaestro_text.datasets.irds.data.Adhoc

 “ORCAS is a click-based dataset associated with the TREC Deep Learning Track. It covers 1.4 million of the TREC DL documents, providing 18 million connections to 10 million distinct queries.” <ul> <li>Queries: From query log</li> <li>Relevance Data: User clicks</li> <li>Scored docs: Indri Query Likelihood model</li> <li><a href=”https://arxiv.org/abs/2006.05324”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-document.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set. All queries have exactly 1 (positive) relevance judgment. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.train.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official train set. All queries have exactly 1 (positive) relevance judgment. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set. All queries have exactly 1 (positive) relevance judgment. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set. All queries have exactly 1 (positive) relevance judgment. scoreddocs are the top 100 results from Indri QL. These are used for the “re-ranking” setting.

Dataset irds.msmarco-document.trec-dl-2019.queries: → datamaestro_text.datasets.irds.data.Topics

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-2019.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-2019.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-2019: → datamaestro_text.datasets.irds.data.Adhoc

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-2019.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-document/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-document.trec-dl-2019.judged.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Subset of <a class=”ds-ref”>msmarco-document/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-document.trec-dl-2019.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-document/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-document.trec-dl-2019.judged: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-document/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-document.trec-dl-2020.queries: → datamaestro_text.datasets.irds.data.Topics

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-2020.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-2020.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-2020: → datamaestro_text.datasets.irds.data.Adhoc

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-2020.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-document.trec-dl-2020.judged.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Subset of <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-document.trec-dl-2020.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-document.trec-dl-2020.judged: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-document.trec-dl-hard.queries: → datamaestro_text.datasets.irds.data.Topics

 A more challenging subset of <a class=”ds-ref”>msmarco-document/trec-dl-2019</a> and <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>. <ul> <li><a href=”https://github.com/grill-lab/DL-Hard”>data website</a></li> <li>See Also: <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-hard.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A more challenging subset of <a class=”ds-ref”>msmarco-document/trec-dl-2019</a> and <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>. <ul> <li><a href=”https://github.com/grill-lab/DL-Hard”>data website</a></li> <li>See Also: <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-hard: → datamaestro_text.datasets.irds.data.Adhoc

 A more challenging subset of <a class=”ds-ref”>msmarco-document/trec-dl-2019</a> and <a class=”ds-ref”>msmarco-document/trec-dl-2020</a>. <ul> <li><a href=”https://github.com/grill-lab/DL-Hard”>data website</a></li> <li>See Also: <a class=”ds-ref”>msmarco-passage/trec-dl-hard</a></li> </ul>

Dataset irds.msmarco-document.trec-dl-hard.fold1.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 1 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 1 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold1: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 1 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold2.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 2 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 2 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold2: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 2 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold3.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 3 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold3.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 3 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold3: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 3 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold4.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 4 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold4.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 4 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold4: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 4 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold5.queries: → datamaestro_text.datasets.irds.data.Topics

 Fold 5 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold5.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Fold 5 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Dataset irds.msmarco-document.trec-dl-hard.fold5: → datamaestro_text.datasets.irds.data.Adhoc

 Fold 5 of <a class=”ds-ref”>msmarco-document/trec-dl-hard</a>

Anchor Text for Version 1 of MS MARCO

For version 1 of MS MARCO, the anchor text collection enriches 1,703,834 documents with anchor text extracted from six Common Crawl snapshots. To keep the collection size reasonable, we sampled 1,000 anchor texts for documents with more than 1,000 anchor texts (this sampling yields that all anchor text is included for 94% of the documents). The <code>text</code> field contains the anchor texts concatenated and the <code>anchors</code> field contains the anchor texts as list. The raw dataset with additional information (roughly 100GB) is <a href=”https://github.com/webis-de/ecir22-anchor-text”>available online</a>.

Dataset irds.msmarco-document.anchor-text.documents: → datamaestro_text.datasets.irds.data.Documents

 For version 1 of MS MARCO, the anchor text collection enriches 1,703,834 documents with anchor text extracted from six Common Crawl snapshots. To keep the collection size reasonable, we sampled 1,000 anchor texts for documents with more than 1,000 anchor texts (this sampling yields that all anchor text is included for 94% of the documents). The <code>text</code> field contains the anchor texts concatenated and the <code>anchors</code> field contains the anchor texts as list. The raw dataset with additional information (roughly 100GB) is <a href=”https://github.com/webis-de/ecir22-anchor-text”>available online</a>.

MSMARCO (document, version 2)

Version 2 of the MS MARCO document ranking dataset. The corpus contains 12M documents (roughly 3x as many as version 1). <ul> <li>Version 1 of dataset: <a class=”ds-ref”>msmarco-document</a></li> <li>Documents: Text extracted from web pages</li> <li>Queries: Natural language questions (from query log)</li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-document-v2.documents: → datamaestro_text.datasets.irds.data.Documents

 Version 2 of the MS MARCO document ranking dataset. The corpus contains 12M documents (roughly 3x as many as version 1). <ul> <li>Version 1 of dataset: <a class=”ds-ref”>msmarco-document</a></li> <li>Documents: Text extracted from web pages</li> <li>Queries: Natural language questions (from query log)</li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul>

Dataset irds.msmarco-document-v2.dev1.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev1 set with 4,552 queries.

Dataset irds.msmarco-document-v2.dev1.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official dev1 set with 4,552 queries.

Dataset irds.msmarco-document-v2.dev1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev1 set with 4,552 queries.

Dataset irds.msmarco-document-v2.dev1: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev1 set with 4,552 queries.

Dataset irds.msmarco-document-v2.dev2.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev2 set with 5,000 queries.

Dataset irds.msmarco-document-v2.dev2.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official dev2 set with 5,000 queries.

Dataset irds.msmarco-document-v2.dev2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev2 set with 5,000 queries.

Dataset irds.msmarco-document-v2.dev2: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev2 set with 5,000 queries.

Dataset irds.msmarco-document-v2.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set with 322,196 queries.

Dataset irds.msmarco-document-v2.train.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official train set with 322,196 queries.

Dataset irds.msmarco-document-v2.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set with 322,196 queries.

Dataset irds.msmarco-document-v2.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set with 322,196 queries.

Dataset irds.msmarco-document-v2.trec-dl-2019.queries: → datamaestro_text.datasets.irds.data.Topics

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document-v2/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document-v2.trec-dl-2019.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document-v2/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document-v2.trec-dl-2019: → datamaestro_text.datasets.irds.data.Adhoc

 Queries from the TREC Deep Learning (DL) 2019 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document-v2/trec-dl-2019/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2003.07820.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document-v2.trec-dl-2019.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-document-v2/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2019.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-document-v2/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2019.judged: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-document-v2/trec-dl-2019</a>, only including queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2020.queries: → datamaestro_text.datasets.irds.data.Topics

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document-v2/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document-v2.trec-dl-2020.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document-v2/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document-v2.trec-dl-2020: → datamaestro_text.datasets.irds.data.Adhoc

 Queries from the TREC Deep Learning (DL) 2020 shared task, which were sampled from <a class=”ds-ref”>msmarco-document/eval</a>. A subset of these queries were judged by NIST assessors, (filtered list available in <a class=”ds-ref”>msmarco-document-v2/trec-dl-2020/judged</a>). <ul> <li><a href=”https://arxiv.org/pdf/2102.07662.pdf”>Shared Task Paper</a></li> </ul>

Dataset irds.msmarco-document-v2.trec-dl-2020.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 Subset of <a class=”ds-ref”>msmarco-document-v2/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2020.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Subset of <a class=”ds-ref”>msmarco-document-v2/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2020.judged: → datamaestro_text.datasets.irds.data.Adhoc

 Subset of <a class=”ds-ref”>msmarco-document-v2/trec-dl-2020</a>, only including queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2021.queries: → datamaestro_text.datasets.irds.data.Topics

 Official topics for the TREC Deep Learning (DL) 2021 shared task. Note that at this time, qrels are only available to those with TREC active participant login credentials.

Dataset irds.msmarco-document-v2.trec-dl-2021.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official topics for the TREC Deep Learning (DL) 2021 shared task. Note that at this time, qrels are only available to those with TREC active participant login credentials.

Dataset irds.msmarco-document-v2.trec-dl-2021.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official topics for the TREC Deep Learning (DL) 2021 shared task. Note that at this time, qrels are only available to those with TREC active participant login credentials.

Dataset irds.msmarco-document-v2.trec-dl-2021: → datamaestro_text.datasets.irds.data.Adhoc

 Official topics for the TREC Deep Learning (DL) 2021 shared task. Note that at this time, qrels are only available to those with TREC active participant login credentials.

Dataset irds.msmarco-document-v2.trec-dl-2021.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 <a class=”ds-ref”>msmarco-document-v2/trec-dl-2021</a>, but filtered down to the 57 queries with qrels. Note that at this time, this is only available to those with TREC active participant login credentials.

Dataset irds.msmarco-document-v2.trec-dl-2021.judged.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 <a class=”ds-ref”>msmarco-document-v2/trec-dl-2021</a>, but filtered down to the 57 queries with qrels. Note that at this time, this is only available to those with TREC active participant login credentials.

Dataset irds.msmarco-document-v2.trec-dl-2021.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 <a class=”ds-ref”>msmarco-document-v2/trec-dl-2021</a>, but filtered down to the 57 queries with qrels. Note that at this time, this is only available to those with TREC active participant login credentials.

Dataset irds.msmarco-document-v2.trec-dl-2021.judged: → datamaestro_text.datasets.irds.data.Adhoc

 <a class=”ds-ref”>msmarco-document-v2/trec-dl-2021</a>, but filtered down to the 57 queries with qrels. Note that at this time, this is only available to those with TREC active participant login credentials.

Dataset irds.msmarco-document-v2.trec-dl-2022.queries: → datamaestro_text.datasets.irds.data.Topics

 Official topics for the TREC Deep Learning (DL) 2022 shared task. Note that these qrels are inferred from the passage ranking task; a document’s relevance label is the maximum of the labels of its passages.

Dataset irds.msmarco-document-v2.trec-dl-2022.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official topics for the TREC Deep Learning (DL) 2022 shared task. Note that these qrels are inferred from the passage ranking task; a document’s relevance label is the maximum of the labels of its passages.

Dataset irds.msmarco-document-v2.trec-dl-2022.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official topics for the TREC Deep Learning (DL) 2022 shared task. Note that these qrels are inferred from the passage ranking task; a document’s relevance label is the maximum of the labels of its passages.

Dataset irds.msmarco-document-v2.trec-dl-2022: → datamaestro_text.datasets.irds.data.Adhoc

 Official topics for the TREC Deep Learning (DL) 2022 shared task. Note that these qrels are inferred from the passage ranking task; a document’s relevance label is the maximum of the labels of its passages.

Dataset irds.msmarco-document-v2.trec-dl-2022.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 <a class=”ds-ref”>msmarco-document-v2/trec-dl-2022</a>, but filtered down to only the queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2022.judged.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 <a class=”ds-ref”>msmarco-document-v2/trec-dl-2022</a>, but filtered down to only the queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2022.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 <a class=”ds-ref”>msmarco-document-v2/trec-dl-2022</a>, but filtered down to only the queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2022.judged: → datamaestro_text.datasets.irds.data.Adhoc

 <a class=”ds-ref”>msmarco-document-v2/trec-dl-2022</a>, but filtered down to only the queries with qrels.

Dataset irds.msmarco-document-v2.trec-dl-2023.queries: → datamaestro_text.datasets.irds.data.Topics

 Official topics for the TREC Deep Learning (DL) 2023 shared task.

Dataset irds.msmarco-document-v2.trec-dl-2023.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official topics for the TREC Deep Learning (DL) 2023 shared task.

Anchor Text for version 2 of MS Marco

For version 2 of MS MARCO, the anchor text collection enriches 4,821,244 documents with anchor text extracted from six Common Crawl snapshots. To keep the collection size reasonable, we sampled 1,000 anchor texts for documents with more than 1,000 anchor texts (this sampling yields that all anchor text is included for 97% of the documents). The <code>text</code> field contains the anchor texts concatenated and the <code>anchors</code> field contains the anchor texts as list. The raw dataset with additional information (roughly 100GB) is <a href=”https://github.com/webis-de/ecir22-anchor-text”>available online</a>.

Dataset irds.msmarco-document-v2.anchor-text.documents: → datamaestro_text.datasets.irds.data.Documents

 For version 2 of MS MARCO, the anchor text collection enriches 4,821,244 documents with anchor text extracted from six Common Crawl snapshots. To keep the collection size reasonable, we sampled 1,000 anchor texts for documents with more than 1,000 anchor texts (this sampling yields that all anchor text is included for 97% of the documents). The <code>text</code> field contains the anchor texts concatenated and the <code>anchors</code> field contains the anchor texts as list. The raw dataset with additional information (roughly 100GB) is <a href=”https://github.com/webis-de/ecir22-anchor-text”>available online</a>.

MSMARCO (passage, version 2)

Version 2 of the MS MARCO passage ranking dataset. The corpus contains 138M passages, which can be linked up with documents in <a class=”ds-ref”>msmarco-document-v2</a>. <ul> <li>Version 1 of dataset: <a class=”ds-ref”>msmarco-passage</a></li> <li>Documents: Text extracted from web pages</li> <li>Queries: Natural language questions (from query log)</li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul> Change Log <ul> <li> On July 21, 2021, the task organizers <a href=”https://github.com/microsoft/msmarco/commit/41b3a684ed8ebd4e753250c3687547a77c62e7dd”> updated the train, dev1, and dev2 qrels</a> to remove duplicate entries from the files. This should not have change results from evaluation tools, but may result in non-repeatable results if these files were used in another process (e.g., model training). The original qrels file for <a class=”ds-ref”>msmarco-passage-v2/train</a> can be found <a href=”https://mirror.ir-datasets.com/abf1fd024b6aca203364d2138c241a6d”>here</a> to aid in result repeatability. </li> </ul>

Dataset irds.msmarco-passage-v2.documents: → datamaestro_text.datasets.irds.data.Documents

 Version 2 of the MS MARCO passage ranking dataset. The corpus contains 138M passages, which can be linked up with documents in <a class=”ds-ref”>msmarco-document-v2</a>. <ul> <li>Version 1 of dataset: <a class=”ds-ref”>msmarco-passage</a></li> <li>Documents: Text extracted from web pages</li> <li>Queries: Natural language questions (from query log)</li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> </ul> Change Log <ul> <li> On July 21, 2021, the task organizers <a href=”https://github.com/microsoft/msmarco/commit/41b3a684ed8ebd4e753250c3687547a77c62e7dd”> updated the train, dev1, and dev2 qrels</a> to remove duplicate entries from the files. This should not have change results from evaluation tools, but may result in non-repeatable results if these files were used in another process (e.g., model training). The original qrels file for <a class=”ds-ref”>msmarco-passage-v2/train</a> can be found <a href=”https://mirror.ir-datasets.com/abf1fd024b6aca203364d2138c241a6d”>here</a> to aid in result repeatability. </li> </ul>

Dataset irds.msmarco-passage-v2.dev1.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev1 set with 3,903 queries. Note that that qrels in this dataset are not directly human-assessed; labels from <a class=”ds-ref”>msmarco-passage</a> are mapped to documents via URL, these documents are re-passaged, and then the best approximate match is identified.

Dataset irds.msmarco-passage-v2.dev1.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official dev1 set with 3,903 queries. Note that that qrels in this dataset are not directly human-assessed; labels from <a class=”ds-ref”>msmarco-passage</a> are mapped to documents via URL, these documents are re-passaged, and then the best approximate match is identified.

Dataset irds.msmarco-passage-v2.dev1.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev1 set with 3,903 queries. Note that that qrels in this dataset are not directly human-assessed; labels from <a class=”ds-ref”>msmarco-passage</a> are mapped to documents via URL, these documents are re-passaged, and then the best approximate match is identified.

Dataset irds.msmarco-passage-v2.dev1: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev1 set with 3,903 queries. Note that that qrels in this dataset are not directly human-assessed; labels from <a class=”ds-ref”>msmarco-passage</a> are mapped to documents via URL, these documents are re-passaged, and then the best approximate match is identified.

Dataset irds.msmarco-passage-v2.dev2.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev2 set with 4,281 queries. Note that that qrels in this dataset are not directly human-assessed; labels from <a class=”ds-ref”>msmarco-passage</a> are mapped to documents via URL, these documents are re-passaged, and then the best approximate match is identified.

Dataset irds.msmarco-passage-v2.dev2.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official dev2 set with 4,281 queries. Note that that qrels in this dataset are not directly human-assessed; labels from <a class=”ds-ref”>msmarco-passage</a> are mapped to documents via URL, these documents are re-passaged, and then the best approximate match is identified.

Dataset irds.msmarco-passage-v2.dev2.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev2 set with 4,281 queries. Note that that qrels in this dataset are not directly human-assessed; labels from <a class=”ds-ref”>msmarco-passage</a> are mapped to documents via URL, these documents are re-passaged, and then the best approximate match is identified.

Dataset irds.msmarco-passage-v2.dev2: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev2 set with 4,281 queries. Note that that qrels in this dataset are not directly human-assessed; labels from <a class=”ds-ref”>msmarco-passage</a> are mapped to documents via URL, these documents are re-passaged, and then the best approximate match is identified.

Dataset irds.msmarco-passage-v2.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set with 277,144 queries.

Dataset irds.msmarco-passage-v2.train.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official train set with 277,144 queries.

Dataset irds.msmarco-passage-v2.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set with 277,144 queries.

Dataset irds.msmarco-passage-v2.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set with 277,144 queries.

Dataset irds.msmarco-passage-v2.trec-dl-2021.queries: → datamaestro_text.datasets.irds.data.Topics

 Official topics for the TREC Deep Learning (DL) 2021 shared task.

Dataset irds.msmarco-passage-v2.trec-dl-2021.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official topics for the TREC Deep Learning (DL) 2021 shared task.

Dataset irds.msmarco-passage-v2.trec-dl-2021.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official topics for the TREC Deep Learning (DL) 2021 shared task.

Dataset irds.msmarco-passage-v2.trec-dl-2021: → datamaestro_text.datasets.irds.data.Adhoc

 Official topics for the TREC Deep Learning (DL) 2021 shared task.

Dataset irds.msmarco-passage-v2.trec-dl-2021.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 <a class=”ds-ref”>msmarco-passage-v2/trec-dl-2021</a>, but filtered down to the 53 queries with qrels.

Dataset irds.msmarco-passage-v2.trec-dl-2021.judged.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 <a class=”ds-ref”>msmarco-passage-v2/trec-dl-2021</a>, but filtered down to the 53 queries with qrels.

Dataset irds.msmarco-passage-v2.trec-dl-2021.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 <a class=”ds-ref”>msmarco-passage-v2/trec-dl-2021</a>, but filtered down to the 53 queries with qrels.

Dataset irds.msmarco-passage-v2.trec-dl-2021.judged: → datamaestro_text.datasets.irds.data.Adhoc

 <a class=”ds-ref”>msmarco-passage-v2/trec-dl-2021</a>, but filtered down to the 53 queries with qrels.

Dataset irds.msmarco-passage-v2.trec-dl-2022.queries: → datamaestro_text.datasets.irds.data.Topics

 Official topics for the TREC Deep Learning (DL) 2022 shared task. Note that the officially-released qrels include relevance labels propagated to duplicate passages, while results presented in the notebook papers remove duplicate documents. This means that the results are not directly comparable, and extra care should be taken when making comparisions among systems to ensure that they were evaluated in the same settings.

Dataset irds.msmarco-passage-v2.trec-dl-2022.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official topics for the TREC Deep Learning (DL) 2022 shared task. Note that the officially-released qrels include relevance labels propagated to duplicate passages, while results presented in the notebook papers remove duplicate documents. This means that the results are not directly comparable, and extra care should be taken when making comparisions among systems to ensure that they were evaluated in the same settings.

Dataset irds.msmarco-passage-v2.trec-dl-2022.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official topics for the TREC Deep Learning (DL) 2022 shared task. Note that the officially-released qrels include relevance labels propagated to duplicate passages, while results presented in the notebook papers remove duplicate documents. This means that the results are not directly comparable, and extra care should be taken when making comparisions among systems to ensure that they were evaluated in the same settings.

Dataset irds.msmarco-passage-v2.trec-dl-2022: → datamaestro_text.datasets.irds.data.Adhoc

 Official topics for the TREC Deep Learning (DL) 2022 shared task. Note that the officially-released qrels include relevance labels propagated to duplicate passages, while results presented in the notebook papers remove duplicate documents. This means that the results are not directly comparable, and extra care should be taken when making comparisions among systems to ensure that they were evaluated in the same settings.

Dataset irds.msmarco-passage-v2.trec-dl-2022.judged.queries: → datamaestro_text.datasets.irds.data.Topics

 <a class=”ds-ref”>msmarco-passage-v2/trec-dl-2022</a>, but filtered down to only the queries with qrels.

Dataset irds.msmarco-passage-v2.trec-dl-2022.judged.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 <a class=”ds-ref”>msmarco-passage-v2/trec-dl-2022</a>, but filtered down to only the queries with qrels.

Dataset irds.msmarco-passage-v2.trec-dl-2022.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 <a class=”ds-ref”>msmarco-passage-v2/trec-dl-2022</a>, but filtered down to only the queries with qrels.

Dataset irds.msmarco-passage-v2.trec-dl-2022.judged: → datamaestro_text.datasets.irds.data.Adhoc

 <a class=”ds-ref”>msmarco-passage-v2/trec-dl-2022</a>, but filtered down to only the queries with qrels.

Dataset irds.msmarco-passage-v2.trec-dl-2023.queries: → datamaestro_text.datasets.irds.data.Topics

 Official topics for the TREC Deep Learning (DL) 2023 shared task.

Dataset irds.msmarco-passage-v2.trec-dl-2023.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official topics for the TREC Deep Learning (DL) 2023 shared task.

msmarco-passage-v2/dedup

Dataset irds.msmarco-passage-v2.dedup.documents: → datamaestro_text.datasets.irds.data.Documents

MSMARCO (QnA)

The MS MARCO Question Answering dataset. This is the source collection of <a class=”ds-ref”>msmarco-passage</a> and <a class=”ds-ref”>msmarco-document</a>. <div class=”warn”> It is prohibited to use information from this dataset for submissions to the MS MARCO passage and document leaderboards or the TREC DL shared task. </div> Query IDs in this collection align with those found in <a class=”ds-ref”>msmarco-passage</a> and <a class=”ds-ref”>msmarco-document</a>. The collection does not provide doc_ids, so these are assigned in the following format: <code>[msmarco_passage_id]-[url_seq]</code>, where <code>[msmarco_passage_id]</code> is the document from <a class=”ds-ref”>msmarco-passage</a> that has matching contents and <code>[url_seq]</code> is assigned sequentially for each URL encountered. In other words, all documents with the same prefix have the same text; they only differ in the originating document. Doc <code>msmarco_passage_id</code> fields are assigned by matching pasasge contents in <a class=”ds-ref”>msmarco-passage</a>, and this field is provided for every document. Doc <code>msmarco_document_id</code> fields are assigned by matching the URL to the one found in <a class=”ds-ref”>msmarco-document</a>. Due to how <a class=”ds-ref”>msmarco-document</a> was constructed, there is not necessarily a match (value will be <code class=”kwd”>None</code> if no match). <ul> <li>Documents: Short passages (from web)</li> <li>Queries: Natural language questions (from query log), including type and natural-language answers.</li> <li><a href=”https://microsoft.github.io/msmarco/#qna”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li><a href=”https://github.com/microsoft/MSMARCO-Question-Answering”>More information</a></li> </ul>

Dataset irds.msmarco-qna.documents: → datamaestro_text.datasets.irds.data.Documents

 The MS MARCO Question Answering dataset. This is the source collection of <a class=”ds-ref”>msmarco-passage</a> and <a class=”ds-ref”>msmarco-document</a>. <div class=”warn”> It is prohibited to use information from this dataset for submissions to the MS MARCO passage and document leaderboards or the TREC DL shared task. </div> Query IDs in this collection align with those found in <a class=”ds-ref”>msmarco-passage</a> and <a class=”ds-ref”>msmarco-document</a>. The collection does not provide doc_ids, so these are assigned in the following format: <code>[msmarco_passage_id]-[url_seq]</code>, where <code>[msmarco_passage_id]</code> is the document from <a class=”ds-ref”>msmarco-passage</a> that has matching contents and <code>[url_seq]</code> is assigned sequentially for each URL encountered. In other words, all documents with the same prefix have the same text; they only differ in the originating document. Doc <code>msmarco_passage_id</code> fields are assigned by matching pasasge contents in <a class=”ds-ref”>msmarco-passage</a>, and this field is provided for every document. Doc <code>msmarco_document_id</code> fields are assigned by matching the URL to the one found in <a class=”ds-ref”>msmarco-document</a>. Due to how <a class=”ds-ref”>msmarco-document</a> was constructed, there is not necessarily a match (value will be <code class=”kwd”>None</code> if no match). <ul> <li>Documents: Short passages (from web)</li> <li>Queries: Natural language questions (from query log), including type and natural-language answers.</li> <li><a href=”https://microsoft.github.io/msmarco/#qna”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li><a href=”https://github.com/microsoft/MSMARCO-Question-Answering”>More information</a></li> </ul>

Dataset irds.msmarco-qna.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

Dataset irds.msmarco-qna.dev.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official dev set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

Dataset irds.msmarco-qna.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

Dataset irds.msmarco-qna.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

Dataset irds.msmarco-qna.eval.queries: → datamaestro_text.datasets.irds.data.Topics

 Official eval set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

Dataset irds.msmarco-qna.eval.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official eval set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

Dataset irds.msmarco-qna.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

Dataset irds.msmarco-qna.train.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official train set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

Dataset irds.msmarco-qna.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

Dataset irds.msmarco-qna.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set. The scoreddocs provides the roughtly 10 passages presented to the user for annotation, where the score indicates the order presented.

nano-beir/arguana

A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.arguana.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.arguana.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.arguana.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.arguana: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the ArguAna Counterargs dataset, for argument retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/P18-1023.pdf”>Dataset paper</a></li> <li><a href=”http://argumentation.bplaced.net/arguana/data”>Dataset website</a></li> </ul>

nano-beir/climate-fever

A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.climate-fever.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.climate-fever.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.climate-fever.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.climate-fever: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the CLIMATE-FEVER dataset, for fact verification on claims about climate. <ul> <li><a href=”https://arxiv.org/pdf/2012.00614.pdf”>Dataset paper</a></li> <li><a href=”https://www.sustainablefinance.uzh.ch/en/research/climate-fever.html”>Dataset website</a></li> </ul>

nano-beir/dbpedia-entity

A version of the DBPedia-Entity-v2 dataset for entity retrieval. <ul> <li><a href=”http://hasibi.com/files/sigir2017-dbpedia_entity.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/iai-group/DBpedia-Entity”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.dbpedia-entity.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the DBPedia-Entity-v2 dataset for entity retrieval. <ul> <li><a href=”http://hasibi.com/files/sigir2017-dbpedia_entity.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/iai-group/DBpedia-Entity”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.dbpedia-entity.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the DBPedia-Entity-v2 dataset for entity retrieval. <ul> <li><a href=”http://hasibi.com/files/sigir2017-dbpedia_entity.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/iai-group/DBpedia-Entity”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.dbpedia-entity.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the DBPedia-Entity-v2 dataset for entity retrieval. <ul> <li><a href=”http://hasibi.com/files/sigir2017-dbpedia_entity.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/iai-group/DBpedia-Entity”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.dbpedia-entity: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the DBPedia-Entity-v2 dataset for entity retrieval. <ul> <li><a href=”http://hasibi.com/files/sigir2017-dbpedia_entity.pdf”>Dataset paper</a></li> <li><a href=”https://github.com/iai-group/DBpedia-Entity”>Dataset website</a></li> </ul>

nano-beir/fever

A version of the FEVER dataset for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/N18-1074.pdf”>Dataset paper</a></li> <li><a href=”https://fever.ai/resources.html”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.fever.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the FEVER dataset for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/N18-1074.pdf”>Dataset paper</a></li> <li><a href=”https://fever.ai/resources.html”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.fever.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the FEVER dataset for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/N18-1074.pdf”>Dataset paper</a></li> <li><a href=”https://fever.ai/resources.html”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.fever.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the FEVER dataset for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/N18-1074.pdf”>Dataset paper</a></li> <li><a href=”https://fever.ai/resources.html”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.fever: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the FEVER dataset for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/N18-1074.pdf”>Dataset paper</a></li> <li><a href=”https://fever.ai/resources.html”>Dataset website</a></li> </ul>

nano-beir/fiqa

A version of the FIQA-2018 dataset (financial opinion question answering). <ul> <li><a href=”https://dl.acm.org/doi/10.1145/3184558.3192301”>Dataset paper</a></li> <li><a href=”https://sites.google.com/view/fiqa/home”>Dataset site</a></li> </ul>

Dataset irds.nano-beir.fiqa.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the FIQA-2018 dataset (financial opinion question answering). <ul> <li><a href=”https://dl.acm.org/doi/10.1145/3184558.3192301”>Dataset paper</a></li> <li><a href=”https://sites.google.com/view/fiqa/home”>Dataset site</a></li> </ul>

Dataset irds.nano-beir.fiqa.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the FIQA-2018 dataset (financial opinion question answering). <ul> <li><a href=”https://dl.acm.org/doi/10.1145/3184558.3192301”>Dataset paper</a></li> <li><a href=”https://sites.google.com/view/fiqa/home”>Dataset site</a></li> </ul>

Dataset irds.nano-beir.fiqa.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the FIQA-2018 dataset (financial opinion question answering). <ul> <li><a href=”https://dl.acm.org/doi/10.1145/3184558.3192301”>Dataset paper</a></li> <li><a href=”https://sites.google.com/view/fiqa/home”>Dataset site</a></li> </ul>

Dataset irds.nano-beir.fiqa: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the FIQA-2018 dataset (financial opinion question answering). <ul> <li><a href=”https://dl.acm.org/doi/10.1145/3184558.3192301”>Dataset paper</a></li> <li><a href=”https://sites.google.com/view/fiqa/home”>Dataset site</a></li> </ul>

nano-beir/hotpotqa

A version of the Hotpot QA dataset for multi-hop question answering. <ul> <li><a href=”https://www.aclweb.org/anthology/D18-1259”>Dataset paper</a></li> <li><a href=”https://github.com/hotpotqa/hotpot”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.hotpotqa.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the Hotpot QA dataset for multi-hop question answering. <ul> <li><a href=”https://www.aclweb.org/anthology/D18-1259”>Dataset paper</a></li> <li><a href=”https://github.com/hotpotqa/hotpot”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.hotpotqa.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the Hotpot QA dataset for multi-hop question answering. <ul> <li><a href=”https://www.aclweb.org/anthology/D18-1259”>Dataset paper</a></li> <li><a href=”https://github.com/hotpotqa/hotpot”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.hotpotqa.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the Hotpot QA dataset for multi-hop question answering. <ul> <li><a href=”https://www.aclweb.org/anthology/D18-1259”>Dataset paper</a></li> <li><a href=”https://github.com/hotpotqa/hotpot”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.hotpotqa: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the Hotpot QA dataset for multi-hop question answering. <ul> <li><a href=”https://www.aclweb.org/anthology/D18-1259”>Dataset paper</a></li> <li><a href=”https://github.com/hotpotqa/hotpot”>Dataset website</a></li> </ul>

nano-beir/msmarco

A version of the MS MARCO passage ranking dataset. Note that this version differs from <a class=”ds-ref”>msmarco-passage</a>, in that it does not correct the encoding problems in the source documents. <ul> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> </ul>

Dataset irds.nano-beir.msmarco.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the MS MARCO passage ranking dataset. Note that this version differs from <a class=”ds-ref”>msmarco-passage</a>, in that it does not correct the encoding problems in the source documents. <ul> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> </ul>

Dataset irds.nano-beir.msmarco.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the MS MARCO passage ranking dataset. Note that this version differs from <a class=”ds-ref”>msmarco-passage</a>, in that it does not correct the encoding problems in the source documents. <ul> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> </ul>

Dataset irds.nano-beir.msmarco.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the MS MARCO passage ranking dataset. Note that this version differs from <a class=”ds-ref”>msmarco-passage</a>, in that it does not correct the encoding problems in the source documents. <ul> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> </ul>

Dataset irds.nano-beir.msmarco: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the MS MARCO passage ranking dataset. Note that this version differs from <a class=”ds-ref”>msmarco-passage</a>, in that it does not correct the encoding problems in the source documents. <ul> <li><a href=”https://microsoft.github.io/msmarco/#ranking”>Leaderboard</a></li> <li><a href=”https://arxiv.org/abs/1611.09268”>Dataset Paper</a></li> <li>See also: <a class=”ds-ref”>msmarco-passage</a></li> </ul>

nano-beir/nfcorpus

A version of the NF Corpus (Nutrition Facts). Data pre-processing may be different than what is done in <a class=”ds-ref”>nfcorpus</a>. <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> <li>See also: <a class=”ds-ref”>nfcorpus</a></li> </ul>

Dataset irds.nano-beir.nfcorpus.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the NF Corpus (Nutrition Facts). Data pre-processing may be different than what is done in <a class=”ds-ref”>nfcorpus</a>. <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> <li>See also: <a class=”ds-ref”>nfcorpus</a></li> </ul>

Dataset irds.nano-beir.nfcorpus.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the NF Corpus (Nutrition Facts). Data pre-processing may be different than what is done in <a class=”ds-ref”>nfcorpus</a>. <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> <li>See also: <a class=”ds-ref”>nfcorpus</a></li> </ul>

Dataset irds.nano-beir.nfcorpus.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the NF Corpus (Nutrition Facts). Data pre-processing may be different than what is done in <a class=”ds-ref”>nfcorpus</a>. <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> <li>See also: <a class=”ds-ref”>nfcorpus</a></li> </ul>

Dataset irds.nano-beir.nfcorpus: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the NF Corpus (Nutrition Facts). Data pre-processing may be different than what is done in <a class=”ds-ref”>nfcorpus</a>. <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> <li>See also: <a class=”ds-ref”>nfcorpus</a></li> </ul>

nano-beir/nq

A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

Dataset irds.nano-beir.nq.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

Dataset irds.nano-beir.nq.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

Dataset irds.nano-beir.nq.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

Dataset irds.nano-beir.nq: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the Natural Questions dev dataset. Data pre-processing differs both from what is done in <a class=”ds-ref”>natural-questions</a> and <a class=”ds-ref”>dpr-w100/natural-questions</a>, especially with respect to the document collection and filtering conducted on the queries. See the Beir paper for details. <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>natural-questions</a>, <a class=”ds-ref”>dpr-w100/natural-questions</a></li> </ul>

nano-beir/quora

A version of the Quora duplicate question detection dataset (QQP). <ul> <li><a href=”https://www.kaggle.com/c/quora-question-pairs”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.quora.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the Quora duplicate question detection dataset (QQP). <ul> <li><a href=”https://www.kaggle.com/c/quora-question-pairs”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.quora.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the Quora duplicate question detection dataset (QQP). <ul> <li><a href=”https://www.kaggle.com/c/quora-question-pairs”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.quora.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the Quora duplicate question detection dataset (QQP). <ul> <li><a href=”https://www.kaggle.com/c/quora-question-pairs”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.quora: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the Quora duplicate question detection dataset (QQP). <ul> <li><a href=”https://www.kaggle.com/c/quora-question-pairs”>Dataset website</a></li> </ul>

nano-beir/scidocs

A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.scidocs.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.scidocs.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.scidocs.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.scidocs: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the SciDocs dataset, used for citation retrieval. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.acl-main.207.pdf”>Dataset paper</a></li> <li><a href=”https://allenai.org/data/scidocs”>Dataset website</a></li> </ul>

nano-beir/scifact

A version of the SciFact dataset, for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset paper</a></li> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.scifact.documents: → datamaestro_text.datasets.irds.data.Documents

 A version of the SciFact dataset, for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset paper</a></li> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.scifact.queries: → datamaestro_text.datasets.irds.data.Topics

 A version of the SciFact dataset, for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset paper</a></li> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.scifact.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 A version of the SciFact dataset, for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset paper</a></li> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset website</a></li> </ul>

Dataset irds.nano-beir.scifact: → datamaestro_text.datasets.irds.data.Adhoc

 A version of the SciFact dataset, for fact verification. <ul> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset paper</a></li> <li><a href=”https://www.aclweb.org/anthology/2020.emnlp-main.609.pdf”>Dataset website</a></li> </ul>

nano-beir/webis-touche2020

Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.nano-beir.webis-touche2020.documents: → datamaestro_text.datasets.irds.data.Documents

 Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.nano-beir.webis-touche2020.queries: → datamaestro_text.datasets.irds.data.Topics

 Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.nano-beir.webis-touche2020.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

Dataset irds.nano-beir.webis-touche2020: → datamaestro_text.datasets.irds.data.Adhoc

 Original version of the Touchè-2020 dataset, for argument retrieval. <div class=”warn”> Consider using <a class=”ds-ref”>beir/webis-touche2020/v2</a> instead; it uses an updated, more complete version of the qrels. </div> <ul> <li><a href=”https://link.springer.com/chapter/10.1007%2F978-3-030-58219-7_26”>Dataset paper</a></li> <li><a href=”https://webis.de/events/touche-20/”>Dataset webiste</a></li> </ul>

neumarco/fa

The <a class=”ds-ref”>msmarco-passage</a> corpus, translated to Persian (Farsi).

Dataset irds.neumarco.fa.documents: → datamaestro_text.datasets.irds.data.Documents

The <a class=”ds-ref”>msmarco-passage</a> corpus, translated to Persian (Farsi).

Dataset irds.neumarco.fa.dev.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/dev</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/dev</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.dev: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/dev</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.dev.judged.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/dev/judged</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.dev.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/dev/judged</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.dev.judged: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/dev/judged</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.train.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.train.docpairs: A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.train: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.train.judged.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.train.judged.docpairs: A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.train.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Persian (Farsi).

Dataset irds.neumarco.fa.train.judged: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Persian (Farsi).

neumarco/ru

The <a class=”ds-ref”>msmarco-passage</a> corpus, translated to Russian.

Dataset irds.neumarco.ru.documents: → datamaestro_text.datasets.irds.data.Documents

The <a class=”ds-ref”>msmarco-passage</a> corpus, translated to Russian.

Dataset irds.neumarco.ru.dev.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/dev</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/dev</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.dev: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/dev</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.dev.judged.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/dev/judged</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.dev.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/dev/judged</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.dev.judged: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/dev/judged</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.train.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.train.docpairs: A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.train: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.train.judged.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.train.judged.docpairs: A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.train.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Russian.

Dataset irds.neumarco.ru.train.judged: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Russian.

neumarco/zh

The <a class=”ds-ref”>msmarco-passage</a> corpus, translated to Chinese.

Dataset irds.neumarco.zh.documents: → datamaestro_text.datasets.irds.data.Documents

The <a class=”ds-ref”>msmarco-passage</a> corpus, translated to Chinese.

Dataset irds.neumarco.zh.dev.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/dev</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/dev</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.dev: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/dev</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.dev.judged.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/dev/judged</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.dev.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/dev/judged</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.dev.judged: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/dev/judged</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.dev.small.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.dev.small.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.dev.small: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/dev/small</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.train.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.train.docpairs: A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.train: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/train</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.train.judged.queries: → datamaestro_text.datasets.irds.data.Topics

A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.train.judged.docpairs: A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.train.judged.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Chinese.

Dataset irds.neumarco.zh.train.judged: → datamaestro_text.datasets.irds.data.Adhoc

A version of <a class=”ds-ref”>msmarco-passage/train/judged</a>, with the corpus translated to Chinese.

NFCorpus (NutritionFacts)

“NFCorpus is a full-text English retrieval data set for Medical Information Retrieval. It contains a total of 3,244 natural language queries (written in non-technical English, harvested from the NutritionFacts.org site) with 169,756 automatically extracted relevance judgments for 9,964 medical documents (written in a complex terminology-heavy language), mostly from PubMed.” <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> </ul>

Dataset irds.nfcorpus.documents: → datamaestro_text.datasets.irds.data.Documents

 “NFCorpus is a full-text English retrieval data set for Medical Information Retrieval. It contains a total of 3,244 natural language queries (written in non-technical English, harvested from the NutritionFacts.org site) with 169,756 automatically extracted relevance judgments for 9,964 medical documents (written in a complex terminology-heavy language), mostly from PubMed.” <ul> <li><a href=”https://www.cl.uni-heidelberg.de/statnlpgroup/nfcorpus/”>Dataset website</li> <li><a href=”https://link.springer.com/chapter/10.1007/978-3-319-30671-1_58”>Dataset paper</li> </ul>

Dataset irds.nfcorpus.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev set. Queries include both title and combinted “all” text field (titles, descriptions, topics, transcripts and comments)

Dataset irds.nfcorpus.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev set. Queries include both title and combinted “all” text field (titles, descriptions, topics, transcripts and comments)

Dataset irds.nfcorpus.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev set. Queries include both title and combinted “all” text field (titles, descriptions, topics, transcripts and comments)

Dataset irds.nfcorpus.dev.nontopic.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev set, filtered to exclude queries from topic pages.

Dataset irds.nfcorpus.dev.nontopic.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev set, filtered to exclude queries from topic pages.

Dataset irds.nfcorpus.dev.nontopic: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev set, filtered to exclude queries from topic pages.

Dataset irds.nfcorpus.dev.video.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev set, filtered to only include queries from video pages.

Dataset irds.nfcorpus.dev.video.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev set, filtered to only include queries from video pages.

Dataset irds.nfcorpus.dev.video: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev set, filtered to only include queries from video pages.

Dataset irds.nfcorpus.test.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test set. Queries include both title and combinted “all” text field (titles, descriptions, topics, transcripts and comments)

Dataset irds.nfcorpus.test.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test set. Queries include both title and combinted “all” text field (titles, descriptions, topics, transcripts and comments)

Dataset irds.nfcorpus.test: → datamaestro_text.datasets.irds.data.Adhoc

 Official test set. Queries include both title and combinted “all” text field (titles, descriptions, topics, transcripts and comments)

Dataset irds.nfcorpus.test.nontopic.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test set, filtered to exclude queries from topic pages.

Dataset irds.nfcorpus.test.nontopic.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test set, filtered to exclude queries from topic pages.

Dataset irds.nfcorpus.test.nontopic: → datamaestro_text.datasets.irds.data.Adhoc

 Official test set, filtered to exclude queries from topic pages.

Dataset irds.nfcorpus.test.video.queries: → datamaestro_text.datasets.irds.data.Topics

 Official test set, filtered to only include queries from video pages.

Dataset irds.nfcorpus.test.video.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official test set, filtered to only include queries from video pages.

Dataset irds.nfcorpus.test.video: → datamaestro_text.datasets.irds.data.Adhoc

 Official test set, filtered to only include queries from video pages.

Dataset irds.nfcorpus.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set. Queries include both title and combinted “all” text field (titles, descriptions, topics, transcripts and comments)

Dataset irds.nfcorpus.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set. Queries include both title and combinted “all” text field (titles, descriptions, topics, transcripts and comments)

Dataset irds.nfcorpus.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set. Queries include both title and combinted “all” text field (titles, descriptions, topics, transcripts and comments)

Dataset irds.nfcorpus.train.nontopic.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set, filtered to exclude queries from topic pages.

Dataset irds.nfcorpus.train.nontopic.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set, filtered to exclude queries from topic pages.

Dataset irds.nfcorpus.train.nontopic: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set, filtered to exclude queries from topic pages.

Dataset irds.nfcorpus.train.video.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set, filtered to only include queries from video pages.

Dataset irds.nfcorpus.train.video.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set, filtered to only include queries from video pages.

Dataset irds.nfcorpus.train.video: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set, filtered to only include queries from video pages.

Natural Questions

Google Natural Questions is a Q&A dataset containing long, short, and Yes/No answers from Wikipedia. <kbd>ir_datasets</kbd> frames this around an ad-hoc ranking setting by building a collection of all long answer candidate passages. However, short and Yes/No annotations are also available in the <kbd>qrels</kbd>, as are the passages presented to the annotators (via <kbd>scoreddocs</kbd>). Importantly, the document collection does not consist of all Wikipedia passages, but instead a union of the candidate passages presented to the annotators (akin to MS MARCO). <a class=”ds-ref”>dph-w100/natural-questions/train</a> and <a class=”ds-ref”>dph-w100/natural-questions/dev</a> contain a filtered set of the questions in this dataset and a full Wikipedia dump (which is a more realistic retrieval setting). <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>dph-w100</a></li> </ul>

Dataset irds.natural-questions.documents: → datamaestro_text.datasets.irds.data.Documents

 Google Natural Questions is a Q&A dataset containing long, short, and Yes/No answers from Wikipedia. <kbd>ir_datasets</kbd> frames this around an ad-hoc ranking setting by building a collection of all long answer candidate passages. However, short and Yes/No annotations are also available in the <kbd>qrels</kbd>, as are the passages presented to the annotators (via <kbd>scoreddocs</kbd>). Importantly, the document collection does not consist of all Wikipedia passages, but instead a union of the candidate passages presented to the annotators (akin to MS MARCO). <a class=”ds-ref”>dph-w100/natural-questions/train</a> and <a class=”ds-ref”>dph-w100/natural-questions/dev</a> contain a filtered set of the questions in this dataset and a full Wikipedia dump (which is a more realistic retrieval setting). <ul> <li><a href=”https://ai.google.com/research/NaturalQuestions”>Dataset website</a></li> <li><a href=”https://storage.googleapis.com/pub-tools-public-publication-data/pdf/1f7b46b5378d757553d3e92ead36bda2e4254244.pdf”>Dataset paper</a></li> <li>See also: <a class=”ds-ref”>dph-w100</a></li> </ul>

Dataset irds.natural-questions.dev.queries: → datamaestro_text.datasets.irds.data.Topics

 Official dev set.

Dataset irds.natural-questions.dev.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official dev set.

Dataset irds.natural-questions.dev.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official dev set.

Dataset irds.natural-questions.dev: → datamaestro_text.datasets.irds.data.Adhoc

 Official dev set.

Dataset irds.natural-questions.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Official train set.

Dataset irds.natural-questions.train.scoreddocs: → datamaestro_text.datasets.irds.data.AdhocRun

 Official train set.

Dataset irds.natural-questions.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Official train set.

Dataset irds.natural-questions.train: → datamaestro_text.datasets.irds.data.Adhoc

 Official train set.

NYT

The New York Times Annotated Corpus. Consists of articles published between 1987 and 2007. It is used in TREC Core 2017 and it is also useful for transferring relevance signals in cases where training data is in short supply. Uses data from <a href=”https://catalog.ldc.upenn.edu/LDC2008T19”>LDC2008T19</a>. The source collection can be downloaded from the LDC.

Dataset irds.nyt.documents: → datamaestro_text.datasets.irds.data.Documents

 The New York Times Annotated Corpus. Consists of articles published between 1987 and 2007. It is used in TREC Core 2017 and it is also useful for transferring relevance signals in cases where training data is in short supply. Uses data from <a href=”https://catalog.ldc.upenn.edu/LDC2008T19”>LDC2008T19</a>. The source collection can be downloaded from the LDC.

Dataset irds.nyt.trec-core-2017.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Common Core 2017 benchmark. Note that this dataset only contains the 50 queries assessed by NIST. <ul> <li>Queries: TREC-style (keyword, description, narrative)</li> <li>Relevance: Deeply-annotated</li> <li><a href=”https://github.com/trec-core/2017”>Shared Task Website</a></li> <li><a href=”https://trec.nist.gov/pubs/trec26/papers/Overview-CC.pdf”>Shared Task Paper</a></li> <ul>

Dataset irds.nyt.trec-core-2017.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Common Core 2017 benchmark. Note that this dataset only contains the 50 queries assessed by NIST. <ul> <li>Queries: TREC-style (keyword, description, narrative)</li> <li>Relevance: Deeply-annotated</li> <li><a href=”https://github.com/trec-core/2017”>Shared Task Website</a></li> <li><a href=”https://trec.nist.gov/pubs/trec26/papers/Overview-CC.pdf”>Shared Task Paper</a></li> <ul>

Dataset irds.nyt.trec-core-2017: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Common Core 2017 benchmark. Note that this dataset only contains the 50 queries assessed by NIST. <ul> <li>Queries: TREC-style (keyword, description, narrative)</li> <li>Relevance: Deeply-annotated</li> <li><a href=”https://github.com/trec-core/2017”>Shared Task Website</a></li> <li><a href=”https://trec.nist.gov/pubs/trec26/papers/Overview-CC.pdf”>Shared Task Paper</a></li> <ul>

Dataset irds.nyt.wksup.queries: → datamaestro_text.datasets.irds.data.Topics

 Training set (without held-out <a class=”ds-ref”>nyt/wksup/valid</a>) for transferring relevance signals from NYT corpus.

Dataset irds.nyt.wksup.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Training set (without held-out <a class=”ds-ref”>nyt/wksup/valid</a>) for transferring relevance signals from NYT corpus.

Dataset irds.nyt.wksup: → datamaestro_text.datasets.irds.data.Adhoc

 Training set (without held-out <a class=”ds-ref”>nyt/wksup/valid</a>) for transferring relevance signals from NYT corpus.

Dataset irds.nyt.wksup.train.queries: → datamaestro_text.datasets.irds.data.Topics

 Training set (without held-out <a class=”ds-ref”>nyt/wksup/valid</a>) for transferring relevance signals from NYT corpus.

Dataset irds.nyt.wksup.train.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Training set (without held-out <a class=”ds-ref”>nyt/wksup/valid</a>) for transferring relevance signals from NYT corpus.

Dataset irds.nyt.wksup.train: → datamaestro_text.datasets.irds.data.Adhoc

 Training set (without held-out <a class=”ds-ref”>nyt/wksup/valid</a>) for transferring relevance signals from NYT corpus.

Dataset irds.nyt.wksup.valid.queries: → datamaestro_text.datasets.irds.data.Topics

 Held-out validation set for transferring relevance signals from NYT corpus (see <a class=”ds-ref”>nyt/wksup/train</a>).

Dataset irds.nyt.wksup.valid.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 Held-out validation set for transferring relevance signals from NYT corpus (see <a class=”ds-ref”>nyt/wksup/train</a>).

Dataset irds.nyt.wksup.valid: → datamaestro_text.datasets.irds.data.Adhoc

 Held-out validation set for transferring relevance signals from NYT corpus (see <a class=”ds-ref”>nyt/wksup/train</a>).

pmc/v1

Subset of PMC articles used for the TREC 2014 and 2015 tasks (v1). Inclues titles, abstracts, full text. Collected from the open access segment on January 21, 2014. <ul> <li><a href=”http://www.trec-cds.org/2014.html#documents”>Information on documents</a></li> <ul>

Dataset irds.pmc.v1.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of PMC articles used for the TREC 2014 and 2015 tasks (v1). Inclues titles, abstracts, full text. Collected from the open access segment on January 21, 2014. <ul> <li><a href=”http://www.trec-cds.org/2014.html#documents”>Information on documents</a></li> <ul>

Dataset irds.pmc.v1.trec-cds-2014.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Clinical Decision Support (CDS) track from 2014. <ul> <li><a href=”http://www.trec-cds.org/2014.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec23/papers/overview-clinical.pdf”>Task Overview Paper</a></li> <ul>

Dataset irds.pmc.v1.trec-cds-2014.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Clinical Decision Support (CDS) track from 2014. <ul> <li><a href=”http://www.trec-cds.org/2014.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec23/papers/overview-clinical.pdf”>Task Overview Paper</a></li> <ul>

Dataset irds.pmc.v1.trec-cds-2014: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Clinical Decision Support (CDS) track from 2014. <ul> <li><a href=”http://www.trec-cds.org/2014.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec23/papers/overview-clinical.pdf”>Task Overview Paper</a></li> <ul>

Dataset irds.pmc.v1.trec-cds-2015.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Clinical Decision Support (CDS) track from 2015. <ul> <li><a href=”http://www.trec-cds.org/2015.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec24/papers/Overview-CL.pdf”>Task Overview Paper</a></li> <ul>

Dataset irds.pmc.v1.trec-cds-2015.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Clinical Decision Support (CDS) track from 2015. <ul> <li><a href=”http://www.trec-cds.org/2015.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec24/papers/Overview-CL.pdf”>Task Overview Paper</a></li> <ul>

Dataset irds.pmc.v1.trec-cds-2015: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Clinical Decision Support (CDS) track from 2015. <ul> <li><a href=”http://www.trec-cds.org/2015.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec24/papers/Overview-CL.pdf”>Task Overview Paper</a></li> <ul>

pmc/v2

Subset of PMC articles used for the TREC 2016 task (v2). Inclues titles, abstracts, full text. Collected from the open access segment on March 28, 2016. <ul> <li><a href=”http://www.trec-cds.org/2016.html#documents”>Information on documents</a></li> <ul>

Dataset irds.pmc.v2.documents: → datamaestro_text.datasets.irds.data.Documents

 Subset of PMC articles used for the TREC 2016 task (v2). Inclues titles, abstracts, full text. Collected from the open access segment on March 28, 2016. <ul> <li><a href=”http://www.trec-cds.org/2016.html#documents”>Information on documents</a></li> <ul>

Dataset irds.pmc.v2.trec-cds-2016.queries: → datamaestro_text.datasets.irds.data.Topics

 The TREC Clinical Decision Support (CDS) track from 2016. <ul> <li><a href=”http://www.trec-cds.org/2016.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec25/papers/Overview-CL.pdf”>Task Overview Paper</a></li> <ul>

Dataset irds.pmc.v2.trec-cds-2016.qrels: → datamaestro_text.datasets.irds.data.AdhocAssessments

 The TREC Clinical Decision Support (CDS) track from 2016. <ul> <li><a href=”http://www.trec-cds.org/2016.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec25/papers/Overview-CL.pdf”>Task Overview Paper</a></li> <ul>

Dataset irds.pmc.v2.trec-cds-2016: → datamaestro_text.datasets.irds.data.Adhoc

 The TREC Clinical Decision Support (CDS) track from 2016. <ul> <li><a href=”http://www.trec-cds.org/2016.html”>Shared task site</a></li> <li><a href=”https://trec.nist.gov/pubs/trec25/papers/Overview-CL.pdf”>Task Overview Paper</a></li> <ul>

Touché Image Search

Corpus version 2022-06-13 with 23 841 images. It was released on June 13, 2022 on <a href=”https://zenodo.org/record/3734893”>Zenodo</a>. This collection is licensed with the <a href=”https://creativecommons.org/licenses/by/4.0/”>Creative Commons Attribution 4.0 International</a>. Individual rights to the content still apply. <ul> <li><a href=”https://zenodo.org/record/6873575”>Zenodo</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/image-retrieval-for-arguments.html”>Touché 2022 task 3 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Touché 2022 lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.touche-image.2022-06-13.documents

Corpus version 2022-06-13 with 23 841 images. It was released on June 13, 2022 on <a href=”https://zenodo.org/record/3734893”>Zenodo</a>. This collection is licensed with the <a href=”https://creativecommons.org/licenses/by/4.0/”>Creative Commons Attribution 4.0 International</a>. Individual rights to the content still apply. <ul> <li><a href=”https://zenodo.org/record/6873575”>Zenodo</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/image-retrieval-for-arguments.html”>Touché 2022 task 3 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Touché 2022 lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.touche-image.2022-06-13.touche-2022-task-3.queries

→ datamaestro_text.datasets.irds.data.AdhocAssessments

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a controversial topic, the task is to retrieve images (from <a class=”ds-ref”>touche-image/2022-06-13</a>) for each stance (pro/con) that show support for that stance. Systems are evaluated on Touché topics 1-50 by the ratio of images among the 20 retrieved images for each topic (10 images for each stance) that are all three: relevant to the topic, argumentative, and have the associated stance. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/image-retrieval-for-arguments.html”>Task 3 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.touche-image.2022-06-13.touche-2022-task-3.qrels

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a controversial topic, the task is to retrieve images (from <a class=”ds-ref”>touche-image/2022-06-13</a>) for each stance (pro/con) that show support for that stance. Systems are evaluated on Touché topics 1-50 by the ratio of images among the 20 retrieved images for each topic (10 images for each stance) that are all three: relevant to the topic, argumentative, and have the associated stance. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/image-retrieval-for-arguments.html”>Task 3 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.touche-image.2022-06-13.touche-2022-task-3

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a controversial topic, the task is to retrieve images (from <a class=”ds-ref”>touche-image/2022-06-13</a>) for each stance (pro/con) that show support for that stance. Systems are evaluated on Touché topics 1-50 by the ratio of images among the 20 retrieved images for each topic (10 images for each stance) that are all three: relevant to the topic, argumentative, and have the associated stance. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/image-retrieval-for-arguments.html”>Task 3 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Touché 2022 Task 2: Argument Retrieval for Comparative Questions

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a comparative topic and a collection of documents, the task is to retrieve relevant argumentative passages for either compared object or for both and to detect their respective stances with respect to the object they talk about. Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. Additionally, classify the stance of the retrieved text passages towards the compared objects in questions. For instance, in the question Who is a better friend, a cat or a dog? the terms cat and dog are the comparison objects. An answer candidate like Cats can be quite affectionate and attentive, and thus are good friends should be classified as pro the cat object, while Cats are less faithful than dogs as supporting the dog object. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/argument-retrieval-for-comparative-questions.html”>Task 2 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.clueweb12.touche-2022-task-2.documents

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a comparative topic and a collection of documents, the task is to retrieve relevant argumentative passages for either compared object or for both and to detect their respective stances with respect to the object they talk about. Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. Additionally, classify the stance of the retrieved text passages towards the compared objects in questions. For instance, in the question Who is a better friend, a cat or a dog? the terms cat and dog are the comparison objects. An answer candidate like Cats can be quite affectionate and attentive, and thus are good friends should be classified as pro the cat object, while Cats are less faithful than dogs as supporting the dog object. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/argument-retrieval-for-comparative-questions.html”>Task 2 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.clueweb12.touche-2022-task-2.queries

→ datamaestro_text.datasets.irds.data.AdhocAssessments

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a comparative topic and a collection of documents, the task is to retrieve relevant argumentative passages for either compared object or for both and to detect their respective stances with respect to the object they talk about. Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. Additionally, classify the stance of the retrieved text passages towards the compared objects in questions. For instance, in the question Who is a better friend, a cat or a dog? the terms cat and dog are the comparison objects. An answer candidate like Cats can be quite affectionate and attentive, and thus are good friends should be classified as pro the cat object, while Cats are less faithful than dogs as supporting the dog object. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/argument-retrieval-for-comparative-questions.html”>Task 2 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.clueweb12.touche-2022-task-2.qrels

Decision making processes, be it at the societal or at the personal level, often come to a point where one side challenges the other with a why-question, which is a prompt to justify some stance based on arguments. Since technologies for argument mining are maturing at a rapid pace, also ad-hoc argument retrieval becomes a feasible task in reach. Touché 2022 is the third lab on argument retrieval at CLEF 2022 featuring three tasks. Given a comparative topic and a collection of documents, the task is to retrieve relevant argumentative passages for either compared object or for both and to detect their respective stances with respect to the object they talk about. Documents are judged based on their general topical relevance and for rhetorical quality, i.e., “well-writtenness” of the document: (1) whether the text has a good style of speech (formal language is preferred over informal), (2) whether the text has a proper sentence structure and is easy to read, (3) whether it includes profanity, has typos, and makes use of other detrimental style choices. Additionally, classify the stance of the retrieved text passages towards the compared objects in questions. For instance, in the question Who is a better friend, a cat or a dog? the terms cat and dog are the comparison objects. An answer candidate like Cats can be quite affectionate and attentive, and thus are good friends should be classified as pro the cat object, while Cats are less faithful than dogs as supporting the dog object. <ul> <li><a href=”https://touche.webis.de/clef22/touche22-web/argument-retrieval-for-comparative-questions.html”>Task 2 website</a></li> <li><a href=”https://touche.webis.de/clef22/touche22-web/”>Lab website</a></li> <li><a href=”https://doi.org/10.1007/978-3-030-99739-7_43”>Overview paper</a></li> </ul>

Dataset irds.clueweb12.touche-2022-task-2