據(jù) HuggingFace 頁面顯示,來自荷蘭馬斯特里赫特大學(xué)的一個研究團(tuán)隊(duì)近日發(fā)布一款可用于大模型研究的伊特魯里亞語數(shù)據(jù)集。
品玩報(bào)道,伊特魯里亞語是一種被用于公元前7世紀(jì)至公元1世紀(jì)的語言,被用在意大利地區(qū)。目前沒有公開的伊特魯里亞語語料庫可用于自然語言處理。
因此,該研究團(tuán)隊(duì)出了一個從伊特魯里亞語到英語的機(jī)器翻譯數(shù)據(jù)集,其中包含來自現(xiàn)有學(xué)術(shù)資源的 2891 個翻譯示例。其中一些例子是人工提取的,另一些則是自動獲取的。
據(jù)研究團(tuán)隊(duì)表示,發(fā)布該數(shù)據(jù)集有助于未來對該語言、類似語言或其他資源稀缺語言的研究。
評論 {{userinfo.comments}}
{{c.content}}
{{child.content}}
{{question.question}}
提交