Skip to content

汉藏双语《现代藏语对照词典》语料公益合作申请 #72

@momo1315

Description

@momo1315

尊敬的MiniMax团队:

您好!

我代表一项公益学术项目,希望与贵方开展数据合作,免费、开源地提供一批高质量的汉藏双语学术词典语料,以支持大语言模型在藏语领域的预训练与能力优化。

本次拟捐赠的语料为《现代藏语对照词典》的电子化内容。该词典是当前藏汉语言领域最权威、最重要的交流工具之一,其编纂与审定过程极为严谨:

  • 编纂历时20余年,组织了来自西藏大学、甘肃西北民族大学、青海师范大学、四川西南民族大学等五省藏区高校的40余位藏汉语言专家共同参与。
  • 期间召开了50多次专家研讨会,对词条进行反复打磨、扩充与校对,最终经权威专家评审后,由四川民族出版社正式出版。
  • 词典收录了近四万条现代常用词汇与新兴术语,每个词条均包含藏汉双语对照、藏文注释及实用例句,内容丰富、准确、实用,在藏区专业人士与民众中享有极高声誉。
    该语料于今日在互联网第一次公开,链接为modelscope,具有很高的稀缺性与学术价值。我们希望能以完全开源的形式,授权贵方将其纳入MiniMax系列模型的预训练数据中,以增强模型对现代藏语的深度理解与生成能力,并可考虑用于替换或优化部分现有藏语训练数据。

为方便贵团队评估,我们可随时提供词典的出版证明。

我们坚信,此批语料的加入,将显著提升MiniMax模型在服务多民族、多语言场景下的能力与包容性。期待能就此公益合作与您进一步探讨。

静候佳音。

祝好!

联系邮箱:951018066@qq.com

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions