ChatGPT là gì và bạn nên sử dụng nó như thế nào?

OpenAI đã giới thiệu một AI trả lời câu hỏi dạng dài có tên là ChatGPT để trả lời các câu hỏi phức tạp một cách đàm thoại.

Đó là một công nghệ mang tính cách mạng vì nó được đào tạo để tìm hiểu ý nghĩa của con người khi họ đặt câu hỏi.

Nhiều người dùng kinh ngạc về khả năng cung cấp phản hồi chất lượng của con người, tạo cảm giác rằng cuối cùng nó có thể có khả năng phá vỡ cách con người tương tác với máy tính và thay đổi cách truy xuất thông tin.

ChatGPT là gì và bạn có thể sử dụng nó như thế nào?

ChatGPT là gì và bạn có thể sử dụng nó như thế nào?

ChatGPT là gì?

ChatGPT là một chatbot mô hình ngôn ngữ lớn được OpenAI phát triển dựa trên GPT-3.5. Nó có một khả năng đáng chú ý là tương tác ở dạng đối thoại đàm thoại và đưa ra những phản hồi có vẻ giống con người một cách đáng ngạc nhiên.

Các mô hình ngôn ngữ lớn thực hiện nhiệm vụ dự đoán từ tiếp theo trong một chuỗi từ.

Học tăng cường với phản hồi của con người (RLHF) là một lớp đào tạo bổ sung sử dụng phản hồi của con người để giúp ChatGPT tìm hiểu khả năng làm theo chỉ dẫn và tạo ra phản hồi làm hài lòng con người.

>>> Có thể bạn cần: Cách tạo tài khoản ChatGPT tại Việt Nam

Ai đã xây dựng ChatGPT?

ChatGPT được tạo bởi công ty trí tuệ nhân tạo OpenAI có trụ sở tại San Francisco. OpenAI Inc. là công ty mẹ phi lợi nhuận của OpenAI LP hoạt động vì lợi nhuận.

OpenAI nổi tiếng với DALL·E nổi tiếng, một mô hình học sâu tạo ra hình ảnh từ các hướng dẫn văn bản được gọi là lời nhắc.

Giám đốc điều hành là Sam Altman, người trước đây là chủ tịch của Y Combinator.

Microsoft là đối tác và nhà đầu tư với số tiền 1 tỷ đô la. Họ đã cùng nhau phát triển Nền tảng Azure AI .

Mô hình ngôn ngữ lớn

ChatGPT là một mô hình ngôn ngữ lớn (LLM). Mô hình ngôn ngữ lớn (LLM) được đào tạo với lượng dữ liệu khổng lồ để dự đoán chính xác từ nào tiếp theo trong câu.

Người ta phát hiện ra rằng việc tăng lượng dữ liệu sẽ làm tăng khả năng làm được nhiều việc hơn của các mô hình ngôn ngữ.

Theo Đại học Stanford :

“GPT-3 có 175 tỷ tham số và được đào tạo trên 570 gigabyte văn bản. Để so sánh, người tiền nhiệm của nó, GPT-2, nhỏ hơn 100 lần với 1,5 tỷ thông số.

Sự gia tăng quy mô này làm thay đổi đáng kể hành vi của mô hình — GPT-3 có thể thực hiện các nhiệm vụ mà nó không được đào tạo rõ ràng, chẳng hạn như dịch các câu từ tiếng Anh sang tiếng Pháp, với rất ít hoặc không có ví dụ đào tạo.

Hành vi này hầu như không có trong GPT-2. Hơn nữa, đối với một số tác vụ, GPT-3 vượt trội so với các mẫu được đào tạo rõ ràng để giải quyết các tác vụ đó, mặc dù trong các tác vụ khác, nó lại kém.”

LLM dự đoán từ tiếp theo trong một chuỗi từ trong câu và các câu tiếp theo – giống như tự động hoàn thành, nhưng ở quy mô khó hiểu.

Khả năng này cho phép họ viết các đoạn văn và toàn bộ trang nội dung.

Nhưng các LLM bị hạn chế ở chỗ không phải lúc nào họ cũng hiểu chính xác con người muốn gì.

Và đó là nơi ChatGPT cải thiện ở trạng thái hiện đại nhất, với chương trình đào tạo Học tăng cường với phản hồi của con người (RLHF) đã nói ở trên.

ChatGPT được đào tạo như thế nào?

GPT-3.5 đã được đào tạo dựa trên lượng dữ liệu khổng lồ về mã và thông tin từ internet, bao gồm các nguồn như thảo luận Reddit, để giúp ChatGPT học cách đối thoại và đạt được phong cách phản hồi của con người.

ChatGPT cũng được đào tạo bằng cách sử dụng phản hồi của con người (một kỹ thuật gọi là Học tăng cường với phản hồi của con người) để AI biết được những gì con người mong đợi khi họ đặt câu hỏi. Đào tạo LLM theo cách này là một cuộc cách mạng vì nó không chỉ đơn giản là đào tạo LLM để dự đoán từ tiếp theo.

ChatGPT được đào tạo như thế nào?

Một bài báo nghiên cứu vào tháng 3 năm 2022 có tiêu đề Các mô hình ngôn ngữ đào tạo để làm theo hướng dẫn với phản hồi của con người  giải thích lý do tại sao đây là một phương pháp đột phá:

“Công việc này được thúc đẩy bởi mục tiêu của chúng tôi là tăng cường tác động tích cực của các mô hình ngôn ngữ lớn bằng cách đào tạo chúng làm những gì một nhóm người nhất định muốn chúng làm.

Theo mặc định, các mô hình ngôn ngữ tối ưu hóa mục tiêu dự đoán từ tiếp theo, mục tiêu này chỉ là đại diện cho những gì chúng tôi muốn các mô hình này thực hiện.

Kết quả của chúng tôi chỉ ra rằng các kỹ thuật của chúng tôi hứa hẹn sẽ làm cho các mô hình ngôn ngữ trở nên hữu ích, trung thực và vô hại hơn.

Làm cho các mô hình ngôn ngữ lớn hơn vốn dĩ không làm cho chúng tốt hơn trong việc tuân theo ý định của người dùng.

Ví dụ: các mô hình ngôn ngữ lớn có thể tạo ra các đầu ra không trung thực, độc hại hoặc đơn giản là không hữu ích cho người dùng.

Nói cách khác, những mô hình này không phù hợp với người dùng của họ.”

Các kỹ sư xây dựng ChatGPT đã thuê các nhà thầu (được gọi là người gắn nhãn) để xếp hạng đầu ra của hai hệ thống, GPT-3 và InstructGPT mới (một “mô hình anh em” của ChatGPT).

Dựa trên xếp hạng, các nhà nghiên cứu đã đưa ra kết luận sau:

“Những người gắn nhãn thích đầu ra InstructGPT hơn đáng kể so với đầu ra từ GPT-3.

Các mô hình InstructGPT cho thấy sự cải thiện về độ trung thực so với GPT-3.

InstructGPT cho thấy những cải tiến nhỏ về độc tính so với GPT-3, nhưng không sai lệch.”

Bài báo nghiên cứu kết luận rằng kết quả cho InstructGPT là tích cực. Tuy nhiên, nó cũng lưu ý rằng có chỗ để cải thiện.

“Nhìn chung, kết quả của chúng tôi chỉ ra rằng việc tinh chỉnh các mô hình ngôn ngữ lớn sử dụng sở thích của con người sẽ cải thiện đáng kể hành vi của họ trong nhiều loại nhiệm vụ, mặc dù vẫn còn nhiều việc phải làm để cải thiện độ an toàn và độ tin cậy của chúng.”

Điều khiến ChatGPT khác biệt so với một chatbot đơn giản là nó được đào tạo đặc biệt để hiểu ý định của con người trong một câu hỏi và đưa ra các câu trả lời hữu ích, trung thực và vô hại.

Do quá trình đào tạo đó, ChatGPT có thể thử thách một số câu hỏi nhất định và loại bỏ những phần không hợp lý của câu hỏi.

Một tài liệu nghiên cứu khác liên quan đến ChatGPT cho thấy cách họ đào tạo AI để dự đoán những gì con người ưa thích.

Các nhà nghiên cứu nhận thấy rằng các số liệu được sử dụng để đánh giá kết quả đầu ra của AI xử lý ngôn ngữ tự nhiên dẫn đến các máy đạt điểm cao về số liệu, nhưng không phù hợp với những gì con người mong đợi.

Sau đây là cách các nhà nghiên cứu giải thích vấn đề:

“Nhiều ứng dụng học máy tối ưu hóa các số liệu đơn giản chỉ là đại diện sơ bộ cho ý định của nhà thiết kế. Điều này có thể dẫn đến các vấn đề, chẳng hạn như các đề xuất trên YouTube quảng cáo mồi nhấp chuột.”

Vì vậy, giải pháp mà họ thiết kế là tạo ra một AI có thể đưa ra các câu trả lời được tối ưu hóa theo ý muốn của con người.

Để làm được điều đó, họ đã đào tạo AI bằng cách sử dụng bộ dữ liệu so sánh của con người giữa các câu trả lời khác nhau để máy dự đoán tốt hơn những gì con người đánh giá là câu trả lời thỏa đáng.

Bài báo chia sẻ rằng việc đào tạo được thực hiện bằng cách tóm tắt các bài đăng trên Reddit và cũng được thử nghiệm trên các tin tức tóm tắt.

Bài báo nghiên cứu từ tháng 2 năm 2022 có tên là Học cách tóm tắt từ phản hồi của con người .

Các nhà nghiên cứu viết:

“Trong nghiên cứu này, chúng tôi chỉ ra rằng có thể cải thiện đáng kể chất lượng tóm tắt bằng cách đào tạo một mô hình để tối ưu hóa theo sở thích của con người.

Chúng tôi thu thập một bộ dữ liệu lớn, chất lượng cao về sự so sánh của con người giữa các bản tóm tắt, đào tạo một mô hình để dự đoán bản tóm tắt mà con người ưa thích và sử dụng mô hình đó làm chức năng khen thưởng để tinh chỉnh chính sách tóm tắt bằng cách sử dụng phương pháp học tăng cường.”

Hạn chế của ChatGTP là gì?

Hạn chế về phản ứng độc hại

ChatGPT được lập trình đặc biệt để không cung cấp các phản hồi độc hại hoặc có hại. Vì vậy, nó sẽ tránh trả lời những loại câu hỏi.

Chất lượng câu trả lời phụ thuộc vào chất lượng chỉ đường

Một hạn chế quan trọng của ChatGPT là chất lượng của đầu ra phụ thuộc vào chất lượng của đầu vào. Nói cách khác, hướng dẫn của chuyên gia (lời nhắc) tạo ra câu trả lời tốt hơn.

Câu trả lời không phải lúc nào cũng đúng

Một hạn chế khác là vì nó được đào tạo để cung cấp câu trả lời phù hợp với con người, nên câu trả lời có thể đánh lừa con người rằng kết quả đầu ra là chính xác.

Nhiều người dùng phát hiện ra rằng ChatGPT có thể đưa ra câu trả lời không chính xác, bao gồm một số câu trả lời cực kỳ sai.

Người điều hành tại trang web Hỏi & Đáp mã hóa Stack Overflow có thể đã phát hiện ra hậu quả không mong muốn của các câu trả lời mà con người cảm thấy đúng.

Stack Overflow tràn ngập phản hồi của người dùng được tạo từ ChatGPT có vẻ đúng, nhưng rất nhiều câu trả lời sai.

Hàng nghìn câu trả lời khiến nhóm điều hành viên tình nguyện choáng ngợp, khiến các quản trị viên ban hành lệnh cấm đối với bất kỳ người dùng nào đăng câu trả lời được tạo từ ChatGPT.

Hàng loạt câu trả lời về ChatGPT dẫn đến một bài đăng có tiêu đề: Chính sách tạm thời: ChatGPT bị cấm :

“Đây là một chính sách tạm thời nhằm làm chậm dòng câu trả lời và nội dung khác được tạo bằng ChatGPT.

…Vấn đề chính là mặc dù các câu trả lời mà ChatGPT tạo ra có tỷ lệ sai cao, nhưng chúng thường “có vẻ như” chúng “có thể” tốt…”

Trải nghiệm của người kiểm duyệt Stack Overflow với các câu trả lời ChatGPT sai nhưng có vẻ đúng là điều mà OpenAI, nhà sản xuất ChatGPT, nhận thức được và cảnh báo trong thông báo về công nghệ mới của họ.

OpenAI giải thích những hạn chế của ChatGPT

Thông báo OpenAI đưa ra cảnh báo này:

“ChatGPT đôi khi viết những câu trả lời nghe có vẻ hợp lý nhưng không chính xác hoặc vô nghĩa.

Khắc phục sự cố này là một thách thức, vì:

(1) trong quá trình đào tạo RL, hiện tại không có nguồn sự thật nào;

(2) huấn luyện mô hình trở nên thận trọng hơn khiến nó từ chối các câu hỏi mà nó có thể trả lời đúng; và

(3) đào tạo có giám sát đánh lừa mô hình vì câu trả lời lý tưởng phụ thuộc vào những gì mô hình biết, hơn là những gì người biểu tình biết.”

ChatGPT có miễn phí sử dụng không?

Việc sử dụng ChatGPT hiện miễn phí trong thời gian “xem trước nghiên cứu”.

Chatbot hiện đang mở để người dùng dùng thử và cung cấp phản hồi về các câu trả lời để AI có thể trả lời các câu hỏi tốt hơn và học hỏi từ những sai lầm của nó.

Thông báo chính thức nói rằng OpenAI rất mong nhận được phản hồi về những sai sót:

“Mặc dù chúng tôi đã nỗ lực để làm cho mô hình từ chối các yêu cầu không phù hợp, nhưng đôi khi mô hình này sẽ phản hồi các hướng dẫn có hại hoặc thể hiện hành vi thiên vị.

Chúng tôi đang sử dụng API kiểm duyệt để cảnh báo hoặc chặn một số loại nội dung không an toàn, nhưng chúng tôi cho rằng hiện tại nó sẽ có một số kết quả khẳng định và phủ định sai.

Chúng tôi mong muốn thu thập phản hồi của người dùng để hỗ trợ công việc đang diễn ra của chúng tôi nhằm cải thiện hệ thống này.”

Hiện đang có một cuộc thi với giải thưởng trị giá 500 đô la tín dụng ChatGPT để khuyến khích công chúng xếp hạng các câu trả lời.

“Người dùng được khuyến khích cung cấp phản hồi về kết quả đầu ra của mô hình có vấn đề thông qua giao diện người dùng, cũng như về các thông tin xác thực/tiêu cực sai từ bộ lọc nội dung bên ngoài cũng là một phần của giao diện.

Chúng tôi đặc biệt quan tâm đến phản hồi liên quan đến các kết quả đầu ra có hại có thể xảy ra trong các điều kiện không có đối nghịch trong thế giới thực, cũng như phản hồi giúp chúng tôi phát hiện và hiểu các rủi ro mới cũng như các biện pháp giảm thiểu có thể có.

Bạn có thể chọn tham gia Cuộc thi phản hồi ChatGPT3 để có cơ hội giành được khoản tín dụng API lên tới $500.

Bài dự thi có thể được gửi qua biểu mẫu phản hồi được liên kết trong giao diện ChatGPT.”

Cuộc thi hiện đang diễn ra kết thúc lúc 11:59 tối theo giờ Thái Bình Dương vào ngày 31 tháng 12 năm 2022.

Các mô hình ngôn ngữ sẽ thay thế Tìm kiếm của Google?

Bản thân Google đã tạo ra một chatbot AI có tên là LaMDA . Hiệu suất của chatbot của Google gần giống với cuộc trò chuyện của con người đến nỗi một kỹ sư của Google đã tuyên bố rằng LaMDA có tri giác .

Dựa vào cách các mô hình ngôn ngữ lớn này có thể trả lời rất nhiều câu hỏi, liệu một ngày nào đó một công ty như OpenAI, Google hay Microsoft có thể thay thế tìm kiếm truyền thống bằng một chatbot AI hay không?

Một số người trên Twitter đã tuyên bố rằng ChatGPT sẽ là Google tiếp theo.

Kịch bản mà một ngày nào đó một chatbot hỏi và trả lời có thể thay thế Google đang gây sợ hãi cho những người kiếm sống bằng nghề tiếp thị tìm kiếm chuyên nghiệp.

Nó đã gây ra các cuộc thảo luận trong các cộng đồng tiếp thị tìm kiếm trực tuyến, như Phòng thí nghiệm SEOSignals nổi tiếng của Facebook, nơi ai đó đã hỏi liệu các tìm kiếm có thể chuyển từ công cụ tìm kiếm sang chatbot hay không.

Sau khi thử nghiệm ChatGPT, tôi phải đồng ý rằng nỗi sợ tìm kiếm bị thay thế bằng chatbot không phải là không có cơ sở.

Công nghệ vẫn còn một chặng đường dài phía trước, nhưng có thể hình dung ra một tương lai tìm kiếm kết hợp và chatbot cho tìm kiếm.

Nhưng việc triển khai ChatGPT hiện tại dường như là một công cụ mà tại một số thời điểm, sẽ yêu cầu mua tín dụng để sử dụng.

ChatGPT có thể được sử dụng như thế nào?

ChatGPT có thể viết mã, thơ, bài hát và thậm chí cả truyện ngắn theo phong cách của một tác giả cụ thể.

Chuyên môn trong việc tuân theo các hướng dẫn nâng ChatGPT từ một nguồn thông tin thành một công cụ có thể được yêu cầu để hoàn thành một nhiệm vụ.

Điều này làm cho nó hữu ích cho việc viết một bài luận về hầu như bất kỳ chủ đề nào.

ChatGPT có thể hoạt động như một công cụ để tạo dàn ý cho các bài báo hoặc thậm chí toàn bộ tiểu thuyết.

Nó sẽ cung cấp phản hồi cho hầu như bất kỳ nhiệm vụ nào có thể được trả lời bằng văn bản.

Phần kết luận

Như đã đề cập trước đây, ChatGPT được hình dung là một công cụ mà công chúng cuối cùng sẽ phải trả tiền để sử dụng.

Hơn một triệu người dùng đã đăng ký sử dụng ChatGPT trong vòng năm ngày đầu tiên kể từ khi nó được mở cho công chúng.

Vietut.com
Logo
Enable registration in settings - general