您当前的位置:首页 > 博客教程

github中文网怎么获取数据集

时间:2024-05-11 23:56 阅读数:4930人阅读

*** 次数:1999998 已用完,请联系开发者***

github中文网怎么获取数据集

360 智脑 7B 参数大模型开源,支持 50 万字长文本输入数据集上达到第一,平均分为第三。在 LongBench(多任务、中英双语、针对大语言模型长文本理解能力的评测基准)测试中,360 选择其中与中文长文本应用最密切相关的中文单文档问答、多文档问答、摘要、Few-shot 等任务进行评测,360Zhinao-7B-Chat-32K 模型取得了平均分第一的成...

e9f75d3a7965facf3abe3fde2b293276.png

百川智能发布开源中英文大模型:可免费商用Github以及Model Scope平台发布。据介绍,baichuan-7B在MMLU的评测中baichuan-7B综合评分达42.5分。训练语料对大模型的训练结果至关重要。在构建预训练语料库方面,百川智能以高质量中文语料为基础,同时融合了优质的英文数据。在数据质量方面,通过质量模型对数据进行打分...

8c552e88d0d8bc9b68f24510a40dbc0b.jpg

(=`′=) 昆仑万维宣布开源“天工”Skywork-13B 系列大模型,0 门槛商用https://modelscope.cn/organization/skyworkSkywork-13B 下载地址(Github):https://github.com/SkyworkAI/Skywork除模型开源外,Skywork-13B 系列大模型还将开源 600GB、150B Tokens 的中文语料数据集 Skypile/Chinese-Web-Text-150B,号称是目前最大的开源中文数据集之一。同时,昆...

d231d2c4e83f4fb984b521b1c4652eb1.png

神灯vp加速器部分文章、数据、图片来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知删除。邮箱:xxxxxxx@qq.com