[{"@type":"PropertyValue","name":"ストレージフォーマット","value":"TXT"},{"@type":"PropertyValue","name":"データ内容","value":"中日平行コーパス"},{"@type":"PropertyValue","name":"データ規模","value":"983万組の中日平行コーパスデータ"},{"@type":"PropertyValue","name":"言語","value":"中国語、日本語"},{"@type":"PropertyValue","name":"応用シーン","value":"機械翻訳"},{"@type":"PropertyValue","name":"正解率","value":"0.9"}]
{"id":1069,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"983万組の中日平行コーパスデータセット","datazy":[{"title":"ストレージフォーマット","desc":"ストレージフォーマット","content":"TXT"},{"title":"データ内容","desc":"データ内容","content":"中日平行コーパス"},{"title":"データ規模","desc":"データ規模","content":"983万組の中日平行コーパスデータ"},{"title":"言語","desc":"言語","content":"中国語、日本語"},{"title":"応用シーン","desc":"応用シーン","content":"機械翻訳"},{"title":"正解率","desc":"正解率","content":"0.9"}],"datatag":"Chinese,Japanese,Sino-Japan,Parallel corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY200214001_demo1711015206921/APY200214001_demo/APY200214001.jpeg","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200214001_demo1711015206921/APY200214001_demo/APY200214001.jpeg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=UWIrRqUw8h3Pnd7JBAu5O%2Bi2CRk%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"983万組の中日平行対訳コーパスは、txtファイルで保存されており、一般、IT、ニュース、特許、国際工学の5つの分野のデータを含みます。データのクリーニング、脱感作、品質チェックが行われており、テキストデータ分析の基礎コーパスとして、機械翻訳などの分野に使用できます。","dataexampl":null,"datakeyword":["中日平行コーパス","中日アライメント","平行コーパスデータ","アライメント平行コーパス"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY200214001_demo1711015206921/APY200214001_demo/APY200214001.jpeg?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=UWIrRqUw8h3Pnd7JBAu5O%2Bi2CRk%3D"}]
983万組の中日平行コーパスデータセット
中日平行コーパス
中日アライメント
平行コーパスデータ
アライメント平行コーパス
983万組の中日平行対訳コーパスは、txtファイルで保存されており、一般、IT、ニュース、特許、国際工学の5つの分野のデータを含みます。データのクリーニング、脱感作、品質チェックが行われており、テキストデータ分析の基礎コーパスとして、機械翻訳などの分野に使用できます。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
2d0967c1-9b1d-4ec4-b78f-c51f371e9b7f