北京大学现代汉语语料库(Beijing University Modern Chinese Corpus,简称BUCMC)是由北京大学中文言 语所建立的一个现代汉语语料库,内容包括政治、经济、文化、社会等方面的文本,涵盖了20世 纪80年代到21世纪初的汉语文本。国产suv推荐
现代北京该语料库采用国家标准《现代汉语语料库分类和编码》,将汉语语料分为10个大类:政治、经济 、文化、社会、科技、教育、军事、体育、旅游、其他。 BUCMC 当前以网络收集为主, 已经收集了 8 万余条网络文本数据,总计超过数百万字,是一个非常庞大的现代汉语语料库。 一元秒杀汽车>悦动车
该语料库可以为各类自然语言处理(NLP)应用提供宝贵的资源,帮助用户快速使用汉语数据,从而推进该领域的发展。
本田锋范2013款
发布评论