更改

跳转至：导航、搜索

ChatGPT对话记录:能否用openai的API创建一个具有我的个性的机器人呢？

添加19字节, 2023年1月25日 (三) 11:04

无编辑摘要

[[文件:ChatGPT00.png|30px]]数据量的大小对于模型的质量有很大影响。大量的数据能够提供更多的信息和更多的示例，从而帮助模型学习更多的知识。

对于训练语言模型来说，通常至少需要几十万到几百万个文本样本。虽然这可能听起来很多，但现在有许多公共数据集可供使用，如'''[[Common Crawl]]'''、'''[[维基百科全书|Wikipedia]]'''等。

但是需要注意的是，数据的质量也很重要。如果数据中有很多的错误、噪声或不相关的信息，可能会对模型的性能造成负面影响。因此，除了数据量之外，数据质量也是非常重要的因素。

行政员、groupone、管理员

16,818

个编辑

取自“http://www.tywiki.com/index.php?title=特殊:移动版差异/119338”