Telegram地下市场中文语料库-TUMCC

Telegram地下市场中文语料库-TUMCC

TUMCC

TUMCC Telegram地下市场中文语料库一个专业术语识别领域的中文语料库,共收集了来自12 个Telegram 群组19821 位Telegram 用户的28,749 个句子,包括804,971 个字符,发布前也完成了数据筛选和分词工作,所以使用起来比较方便,而且还有整理后的版本,有需要的可以到GitHub上面学习。

Telegram地下市场中文语料库-TUMCC

Telegram地下市场中文语料库

地址:https://github.com/m1-llie/TUMCC

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

评论(0)

提示:请文明发言

您的电子邮箱地址不会被公开。 必填项已用 * 标注