- 主页 > 生活百科 > >
ChatGPT/InstructGPT详解( 六 )
^Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. and Sutskever, I., 2019. Language models are unsupervised multitask learners. *OpenAI blog*, *1*(8), p.9. https://life-extension.github.io/2020/05/27/GPT%E6%8A%80%E6%9C%AF%E5%88%9D%E6%8E%A2/language-models.pdf ^Brown, Tom B., Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared Kaplan, Prafulla Dhariwal, Arvind Neelakantan et al. “Language models are few-shot learners.” *arXiv preprint arXiv:2005.14165* (2020). https://proceedings.neurips.cc/paper/2020/file/1457c0d6bfcb4967418bfb8ac142f64a-Paper.pdf ^Wei, Jason, et al. "Finetuned language models are zero-shot learners." *arXiv preprint arXiv:2109.01652* (2021). https://arxiv.org/pdf/2109.01652.pdf ^Christiano, Paul F., et al. "Deep reinforcement learning from human preferences." *Advances in neural information processing systems* 30 (2017). https://arxiv.org/pdf/1706.03741.pdf ^Schulman, John, et al. "Proximal policy optimization algorithms." *arXiv preprint arXiv:1707.06347* (2017). https://arxiv.org/pdf/1707.06347.pdf?
推荐阅读
-
车家号宝马7系e38气动避震悬挂改装,【多图】当年的大佬
-
崆峒养生汇|养血管就是养命,40岁后多吃五大食物,不怕血管堵
-
银行|全球银行遭疫情“暴击” 贷款损失将高达2.1万亿美元
-
-
【hysound曹曹】嘴唇干裂脱皮要知道其中的原因 如何对症治疗
-
精彩图集社|彰显大气!,李英爱同款#54号丝绒唇膏
-
可能与新冠法国累计报告144例儿童类川崎病病例 可能与新冠有关
-
-
除电商和旅游业外,农村这三种新兴行业,让很多人发家!
-
手机大魔王:后置滚筒设计+麒麟1020华为Mate40,华为Mate30闻声价崩遭疯抢
-
-
公司|注意!浙江龙盛:股东项志峰拟减持不超过约1.07亿股
-
-
「古镇」中国唯一“活着”的古镇,游客少门票免费,很多人读错名字
-
-
『李白』李白重做方案已定,史诗增强,三形态皮肤七月上架
-
大众汽车|“神车”归来便被捧红,上市6天卖出2378辆,骂得越多卖的越好
-
-
2020生活记忆:这一年你还好么?是否跟我一样,兜兜转转还在原点
-
富国|前7月36只混基涨超80% 融通长城富国旗下基金领涨