ChatGPT

Iste articlo ye en proceso de cambio enta la ortografía oficial de Biquipedia (la Ortografía de l'aragonés de l'Academia Aragonesa d'a Luenga). Puez aduyar a completar este proceso revisando l'articlo, fendo-ie los cambios ortograficos necesarios y sacando dimpués ista plantilla.

ChatGPT ye un prototipo d'un chatbot basau en intelichencia artificial. Estió desembolicau per OpenAI y lanzau en noviembre de 2022. O chatbot s'entrenó con RLHF (Reinforcement Learning from Human Feedback ("aprendizache reforzau a partir de comentarios humans", una mena d'aprendizache reforzau)^[1] y PPO (Proximal Policy Optimization ("optimización de politica proxima", unatra forma d'aprendizache reforzau)^[2], y fa servir a dentrada de texto y la salida fa servir intelichencia artificial GPT-3.5 (GPT significa Generative Pre-trained Transformer ("transformador preentrenau chenerativo"), una versión amillorada de GPT-3 d'OpenAI.

Seguntes a suya experiencia en o desembolique de GPT y Codex, OpenAI ha incorporau numbrosas midas de seguranza pa privar respuestas incorrectas y maliciosas. Pa amillorar o suyo modelo, a intelichencia artificial (IA) de ChatGPT se millora de contino con comentarios humans.

ChatGPT se lanzó lo 30 de noviembre de 2022 y ha clamau l'atención per as suyas respuestas detalladas y articuladas, encara que s'ha criticau la suya precisión factica. O servicio s lanzó en primeras de baldes pa lo publico, con plans de monetizar-lo mas adebant. O 4 d'aviento, OpenAI calculaba que Cmas d'un millón d'usuarios.^[3]

Vinclos externos editar

Pachina web oficial de ChatGPT.

Referencias editar

↑ (en) Paul Christiano, Jan Leike, Tom B. Brown, Miljan Martic, Shane Legg, Dario Amodei: Deep reinforcement learning from human preferences. 13. Juli 2017, doi:10.48550/arxiv.1706.03741
↑ (en) John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov: Proximal Policy Optimization Algorithms. 28. August 2017, doi:10.48550/arxiv.1707.06347
↑ (en) What is ChatGPT and why does it matter? Here's what you need to know en zdnet.com

[1] (en) Paul Christiano, Jan Leike, Tom B. Brown, Miljan Martic, Shane Legg, Dario Amodei: Deep reinforcement learning from human preferences. 13. Juli 2017, doi:10.48550/arxiv.1706.03741

[2] (en) John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov: Proximal Policy Optimization Algorithms. 28. August 2017, doi:10.48550/arxiv.1707.06347

[3] (en) What is ChatGPT and why does it matter? Here's what you need to know en zdnet.com

[1]

[2]

[3]