[{"@type":"PropertyValue","name":"データ内容","value":"中英並列コーパスデータ"},{"@type":"PropertyValue","name":"データ規模","value":"8012万組中英並列コーパスデータ"},{"@type":"PropertyValue","name":"保存フォーマット","value":"txt"},{"@type":"PropertyValue","name":"言語","value":"中国語、英語"},{"@type":"PropertyValue","name":"応用シーン","value":"機械翻訳(MT)"}]
{"id":147,"datatype":"1","titleimg":"https://jp.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp","type1":"183","type1str":null,"type2":"185","type2str":null,"dataname":"8012万組の中英並列コーパスデータ","datazy":[{"title":"データ内容","desc":"データ内容","content":"中英並列コーパスデータ"},{"title":"データ規模","desc":"データ規模","content":"8012万組中英並列コーパスデータ"},{"title":"保存フォーマット","desc":"保存フォーマット","content":"txt"},{"title":"言語","desc":"言語","content":"中国語、英語"},{"title":"応用シーン","desc":"応用シーン","content":"機械翻訳(MT)"}],"datatag":"Chinese-English,Parallel Corpus","technologydoc":null,"downurl":null,"datainfo":null,"standard":null,"dataylurl":null,"flag":null,"publishtime":null,"createby":null,"createtime":null,"ext1":null,"samplestoreloc":null,"hosturl":null,"datasize":null,"industryPlan":null,"keyInformation":"","samplePresentation":[{"name":"/data/apps/damp/temp/ziptemp/APY170101223_demo1709805600140/APY170101223-demo/zh-en ????.png","url":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY170101223_demo1709805600140/APY170101223-demo/zh-en%20%3F%3F%3F%3F.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=hV7rToYxKOSn4Bomdmt%2Bqtp2maY%3D","intro":"","size":0,"progress":100,"type":"jpg"}],"officialSummary":"中英並列コーパスは、テキスト(.txt)フォーマットで保存されたメモリデータで、観光・医療・日常会話、及びテレビドラマなど多分野に幅広く活用されています。また、データの前処理済みで、テキストデータ分析の基盤コーパスとして、機械翻訳などの分野にも活用されています。","dataexampl":null,"datakeyword":["中英並列コーパスデータ","中英アライメント","コーパス"],"isDelete":null,"ids":null,"idsList":null,"datasetCode":null,"productStatus":null,"tagTypeEn":"Type","tagTypeZh":null,"website":null,"samplePresentationList":null,"datazyList":null,"keyInformationList":null,"dataexamplList":null,"bgimg":null,"datazyScriptList":null,"datakeywordListString":null,"sourceShowPage":"nlu","BGimg":"","voiceBg":["/shujutang/static/image/comm/audio_bg.webp","/shujutang/static/image/comm/audio_bg2.webp","/shujutang/static/image/comm/audio_bg3.webp","/shujutang/static/image/comm/audio_bg4.webp","/shujutang/static/image/comm/audio_bg5.webp"]}
https://jp.nexdata.ai/shujutang/static/image/index/datatang_wenben_default.webp
[{"@type":"ImageObject","embedUrl":"https://bj-oss-datatang-03.oss-cn-beijing.aliyuncs.com/filesInfoUpload/data/apps/damp/temp/ziptemp/APY170101223_demo1709805600140/APY170101223-demo/zh-en%20%3F%3F%3F%3F.png?Expires=4102329599&OSSAccessKeyId=LTAI8NWs2pDolLNH&Signature=hV7rToYxKOSn4Bomdmt%2Bqtp2maY%3D"}]
8012万組の中英並列コーパスデータ
中英並列コーパスデータ
中英アライメント
コーパス
中英並列コーパスは、テキスト(.txt)フォーマットで保存されたメモリデータで、観光・医療・日常会話、及びテレビドラマなど多分野に幅広く活用されています。また、データの前処理済みで、テキストデータ分析の基盤コーパスとして、機械翻訳などの分野にも活用されています。
このデータセットは、商用利用や研究目的などに役立つ有償のデータセットです。著作権ありの既製データセットは、AIプロジェクトの飛躍的なスタートに役立ちます。
![仕様]()
データ仕様
![サンプル]()
サンプル
![おすすめデータセット]()
おすすめデータセット
cac05f01-b909-4fb9-86e4-0b3e04c267ac