语料库有哪些(现代汉语平衡语料库

对汉语国际教育的学生来说,语料库的运用还是很重要的,利用语料库写论文比较方便。 例如,错误分析留学生的汉字并写它时,有必要使用预想。 通常,词汇收集并不容易,如果需要的词汇庞大,就需要向很多人求助。 … Continue reading 语料库有哪些(现代汉语平衡语料库

Meta 发布首个「非参数化」掩码语言模型 NPM :吊打 500 倍参数量的 GPT-3

 Meta 发布首个非参数化掩码语言模型 NPM:那年双手插兜,不知道什么叫做 out of vocabulary 虽然大型语言模型在 NLP 领域展现出的强大性能十分惊人,但其带来的负面代 … Continue reading Meta 发布首个「非参数化」掩码语言模型 NPM :吊打 500 倍参数量的 GPT-3

Facebook开源最大规模并行语料,45亿规模

雷锋网AI科技评论按:当前自然语言处理中的大多数方法都是数据驱动的,大多数多语言模型(特别是神经机器翻译系统)都需要并行语料库进行训练。大多数的并行文本都只是适用于几个主要语言(例如英语、汉语),且限 … Continue reading Facebook开源最大规模并行语料,45亿规模