このページは、論文で紹介されているデータセットを参照しています。
新しいのは MarkIT です。マークされた構造のイタリアのツリーバンクです。 Teresa Paccosi、Alessio Palmero Aprosio、Sara Tonelli が、2022 年第 8 回イタリア計算言語学会議の予稿集に掲載予定 (CLIC-it 2021)
MarkIT リソースには、構文依存関係を手動で注釈を付けた学生の作文から抽出された約 800 の文が含まれています。ツリーバンクは、7 種類のマーク付き構文に加えて、その構文が誤ってマーク付きとして分類される可能性のあるいくつかのあいまいな文をカバーしています。
MarkIT はイタリア語でマークされた構造のツリーバンクで、依存関係の注釈が付けられた約 800 文が含まれています。まず、Tint を使用して文に自動的に注釈を付けます。次に、データセット全体に対して手動でエラーを修正します。このリソースは、7 種類のマーク付き構文に加えて、その構文が誤ってマーク付きとして分類される可能性のあるいくつかのあいまいな文をカバーしています。
データセットの選択、抽出、および注釈は、Teresa Paccosi、Alessio Palmero Aprosio、および Sara Tonelli によって実行されました。
=== 機械可読メタデータ (削除しないでください!) ================================ 利用可能なデータ: UD vX.X ライセンス: CC BY 4.0 テキストが含まれます: はい ジャンル: 学習者エッセイ 補題: 自動 (修正あり) UPOS: 自動修正あり XPOS: 自動修正あり 機能: 自動補正付き 関連: マニュアルネイティブ 寄稿者: Paccosi、Teresa;パルメロ・アプロシオ、アレッシオ。サラ・トネリ 寄稿: 他所 連絡先: [email protected] ================================================= =============================