auの日記

プログラミング初心者の日記。(auはハンドルネームです)

IT用語のコーパスとは

auです。

コーパスの意味について調べてみました。

コーパスとは

コーパスとは、自然言語(日本語や英語など)の文書を集めたものです。

AIやディープラーニングの分野で、自然言語処理をする場合の学習データとして用いられます。

コーパスの中にも複数の種類があるようです。

ラジオやテレビ、電話の会話などの話し言葉を集めた「音声言葉コーパス」、文書に品詞などを付与してある「タグ付きコーパス」などがあり、それぞれの利用用途に沿ったコーパスを作成するようです。

コーパスは、人間が使ういろいろな言葉を集めたものだと理解しました。