nlp-datasets

Star

Here are 144 public repositories matching this topic...

mihail911 / nlp-library

Star

curated collection of papers for the nlp practitioner ???????

nlp machine-learning deep-learning neural-network dialogue neural-machine-translation language-model nlp-datasets

Updated Aug 5, 2020

hellohaptik / multi-task-NLP

Star

multi_task_NLP is a utility toolkit enabling NLP developers to easily train and infer a single model for multiple tasks.

nlp transformers pytorch named-entity-recognition ranking sentence-classification nlp-apis nlp-library sequence-labeling machine-comprehension context-awareness entailment intent-classification nlp-datasets multitask-learning nli-tasks

Updated Nov 21, 2022
Python

dkulagin / kartaslov

Star

Открытые лингвистические датасеты: тональный словарь русского языка КартаСловСент, датасет по семантике, ассоциативный граф и датасет по орфографическим ошибкам и опечаткам.

russian-specific computational-linguistics datasets nlp-datasets

Updated Nov 24, 2021

quincyliang / nlp-public-dataset

Star

Chinese, English NER, English-Chinese machine translation dataset. 中英文?????据集，中英文机器???据集, 中文分??据集

machine-learning-dataset nlp-datasets

Updated Feb 3, 2021
Python

guhhhhaa / 4675-scifi

Star

chinese NLP corpus of chinese science fiction,chinese science fiction corpus : About 4675 Chinese science fiction novels 大?有4675本科幻小?，中文科幻小?自然?言?理?料?，中文科幻小?文本?料?，中文科幻小?文本?据?，科幻小??料

nlp corpus science-fiction scifi chinese-nlp corpus-data datasets nlp-resources nlp-machine-learning nlp-datasets

Updated Oct 22, 2022

grammarly / ua-gec

Star

UA-GEC: Grammatical Error Correction and Fluency Corpus for the Ukrainian Language

natural-language-processing corpus dataset corpus-data corpus-tools gec nlp-datasets grammatical-error-correction ukrainian-language

Updated Feb 11, 2024
Macaulay2

irfnrdh / Awesome-Indonesia-NLP

Sponsor

Star

Resource NLP & Bahasa

awesome nlp-resources indonesian-language nlp-datasets

Updated Nov 13, 2019

INK-USC / TriggerNER

Star

TriggerNER: Learning with Entity Triggers as Explanations for Named Entity Recognition (ACL 2020)

information-extraction dataset named-entity-recognition nlp-resources nlp-datasets low-resource sequence-tagging

Updated Jun 15, 2022
Python

cjiang2 / VDCNN

Star

Implementation of Very Deep Convolutional Neural Network for Text Classification

nlp text-classification tensorflow keras convolutional-neural-networks keras-tensorflow vdcnn nlp-datasets

Updated Jun 28, 2022
Python

liutiedong / goat

Star

a Fine-tuned LLaMA that is Good at Arithmetic Tasks

ai nlp-datasets llms

Updated Sep 15, 2023
Jupyter Notebook

INK-USC / CommonGen

Star

A Constrained Text Generation Challenge Towards Generative Commonsense Reasoning

natural-language-processing deep-learning text-generation natural-language-generation nlg-dataset commonsense-reasoning nlp-datasets machine-reasoning language-generation-dataset

Updated Jan 5, 2024
Python

xtea / chinese_medical_words

Star

手工整理??行???、??等?料。可用于?音??、??系?等各?nlp模型??。

nlp medical chinese-nlp chinese-word-segmentation nlp-datasets nlp-data-to-text

Updated Apr 5, 2020

guhhhhaa / wula-scifi

Star

chinese NLP corpus of chinese science fiction, chinese science fiction corpus: Archive of the Ark Plan of Ula Science Fiction Website ?拉科幻小??方舟??存?，中文科幻小?自然?言?理?料?，中文科幻小?文本?料?，中文科幻小?文本?据?，科幻小??料

nlp corpus science-fiction scifi chinese-nlp corpus-data datasets nlp-resources nlp-machine-learning nlp-datasets

Updated Oct 22, 2022

secsilm / zi-dataset

Star

?字?据集，包括?字的相?信息，例如???、部首、?音、英文??/同??等。

nlp dataset chinese-nlp hanzi nlp-datasets chinese-dataset

Updated Jul 17, 2020

Pzoom522 / HistSumm

Star

Code and data for "Summarising Historical Text in Modern Languages" (EACL 2021)

ancient-languages nlp-datasets cross-lingual-summarization summariser historical-text eacl2021

Updated Apr 22, 2021
Jupyter Notebook

kelvin-jiang / FreebaseQA

Star

The release of the FreebaseQA data set (NAACL 2019).

naacl question-answering freebase nlp-datasets kb-qa freebaseqa

Updated Aug 11, 2022

Niger-Volta-LTI / yoruba-text

Star

Yoruba language training text for NLP, ASR and TTS tasks

nlp natural-language-processing machine-translation tts african-languages yoruba asr diacritization training-dataset nlp-datasets

Updated Mar 3, 2023
Python

gcunhase / AMICorpusXML

Star

Extracts Transcript and Summary (Abstractive and Extractive) from the AMI Meeting Corpus

nlp-datasets meeting-dataset xml-to-story convert-to-cnn-dm-format

Updated Dec 4, 2019
Python

fido-ai / ua-datasets

Star

A collection of datasets for Ukrainian language

nlp natural-language-processing text-classification dataset question-answering nlp-datasets ukrainian-language token-classification

Updated Nov 25, 2023
Python

matt-seb-ho / WikiWhy

Star

WikiWhy is a new benchmark for evaluating LLMs' ability to explain between cause-effect relationships. It is a QA dataset containing 9000+ "why" question-answer-rationale triplets.

nlp machine-learning artificial-intelligence dataset question-answering nlp-datasets explainable-ai open-domain-qa iclr2023

Updated Dec 7, 2023
Python

Improve this page

Add a description, image, and links to the nlp-datasets topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the nlp-datasets topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

nlp-datasets

Here are 144 public repositories matching this topic...

mihail911 / nlp-library

hellohaptik / multi-task-NLP

dkulagin / kartaslov

quincyliang / nlp-public-dataset

guhhhhaa / 4675-scifi

grammarly / ua-gec

irfnrdh / Awesome-Indonesia-NLP

INK-USC / TriggerNER

cjiang2 / VDCNN

liutiedong / goat

INK-USC / CommonGen

xtea / chinese_medical_words

guhhhhaa / wula-scifi

secsilm / zi-dataset

Pzoom522 / HistSumm

kelvin-jiang / FreebaseQA

Niger-Volta-LTI / yoruba-text

gcunhase / AMICorpusXML

fido-ai / ua-datasets

matt-seb-ho / WikiWhy

Improve this page

Add this topic to your repo