Alec Radford , cha đẻ của ChatGPT và hé lộ sự cách làm việc, thiên tài đằng sau đó (phần kết)
Hé lộ cách làm việc và thiên tài AI Alec Radford
1. Mở đầu:
Mình cảm giác bài viết trước về Alec thật sự quá sơ sài nên hôm nay lấy cảm hứng từ những bài viết của thefour , mình quay lại viết về Alec Radford cho thật chỉnh chu
Một chút suy nghĩ lo lắng: Thời gian mình không còn nhiều , những hôm đi đường ở HN , mình cảm giác như chết đi sống lại vậy. Mình viết bài này lúc chờ cơm chín =)
Bài viết này mình sẽ không dùng AI để viết vì mình ghét chất xám giả tạo và hoàn hảo đó dù mình làm về AI engineer ahihi. Mình có kinh nghiệm về Computer Vision (detect , track, recognition) , Machine translation , ASR, NLP, API backend =) nên hi vọng sẽ viết cho độc giả yên tâm hơn
2. Giới thiệu qua về Alec Radford
Alec Radford là cựu Research Scientist của công ty OpenAI , công ty đã tạo ra cơn địa chấn ChatGPT, bắt đầu làn sóng mạnh xâm chiếm toàn cầu bằng từ khóa AI suốt 4 năm qua.
Những người thực sự hiểu cách ChatGPT hay LLMs (Large language models - mô hình ngông ngữ lớn) hoạt động càng thấy nó thật sự tuyệt vời đan xen thấy nhàm chán khi biết quy tắc vận hành , thuật toán đằng sau là gì , may quá không có ma thuật đen nào đằng sau những thuật toán đó. Alec đã là first author của 2 bài báo GPT 1 và GPT 2 , đặt nền móng cho GPT3 thành công ; nên có thể coi Alec là cha để GPT cùng với John Schulman (giống Harry potter cực) và vài người khác.
2.5 Một tên mọt sách
Alec Radford là 1 tên mọt sách , đúng , như bao thiên tài AI khác mà mình biết được , từ CEO của Deepseek (Liang Wenfeng 梁文锋) đến những người làm khoa học như John Schulman (OpenAI) , Kaiming He, …
Họ là những người với cái mái tóc ko được cắt gọn , ko ai biết đến tên ngoại trừ giới nghiên cứu AI ; họ là những người rất giỏi (toán , logic, sáng tạo kỹ thuật, và cởi mở với ý tưởng mới) và đặc biệt họ ko cần ánh đèn sân khấu chiếu về mình . Khoa học cần sự tận tâm và yên tĩnh và những phản biện thật sự sắc bén , một môi trường mà cần khơi dậy tư duy phản biện về kỹ thuật rất sắc (critical think), nơi ý tưởng đập và nảy (bounce idea), nơi mà những cái vụn vặt , drama xã hội , ko cần có nhu cầu xuất hiện.
Mình đã từng ghét mọt sách , nhưng nhìn lại , chính mình đang muốn dần trở thành phiên bản đó, ít nhất là tránh được drama ngày qua ngày đang muốn ngấu nghiến bởi mọi người ngoài kia. Đặc biệt là Alec ko còn dùng X (twitter, reddit) từ sau DCGAN công bố đến hết 2018. Tuyệt vời. Einstein thời hiện đại sẽ là người ko dùng toktok.
Solvay conference 1927 (all brilliant minds in 1 pic)
Deepseek CEO (Liang Wenfeng, a 40-years old nerd finally success)
3. 3 cuộc cách mạng AI
Alec là 1 người đã mở ra cuộc cách mạng về AI hay nói chính xác hơn là cuộc cách mạng về lĩnh vực học sâu (deep learning) trong Computer Vision (với bài báo DCGAN và CLIP), Large Language Models (với bài báo mô hình GPT1 và GPT2), ASR (Autmomatic Speak Recognition) với bài báo Whisper. Việc thống trị 3 mảng khác nhau về AI về hình ảnh , ngôn ngữ và âm thanh là quá nhiều nhưng sao cậu ấy có thể tạo ra 3 cơ sóng thần cho 3 mảng như vậy.
Các bài báo mình sẽ để cuối bài viết này
Để hiểu được sự thiên tài của Alec , bạn cần đi qua 3 bài báo của cậu ấy, đừng lo , mình sẽ chỉ nói theo ngôn ngữ bình dân , vì chính mình cũng ko thể hiểu được ở mức sâu và chi tiết , nhưng đừng lo , mình cảm thấy bản thân đã đứng vững hơn so với lần viết trước về báo của cậu này. Qua xem hết video có mặt Alec trên mạng và đọc kĩ 3 bài báo Whisper, CLIP, Amazon Sentiment Analysis mình hiểu được phần nào về anh bạn này
4. Những nước đi thiên tài
Alec đã từng tiết lộ nước đi thiên tài của cậu ấy xuất hiện từ
Đóng vai làm 1 AI engineer (kỹ sư AI) trong hình hài chức vụ AI researcher (nhà khoa học AI)
- Không cần cố nghĩ ra thuật toán mới , đẹp , hoàn hảo cho tất cả lý thuyết (don’t think for a optimal solution for all, try to be practical each day, what can be done now to yield result)
- Lấy mô hình tốt nhất của người khác (phát minh siêu giỏi) rồi cải thiện nó (theo mình hiểu là làm nó tốt lên tầm 3% chẳng hạn , chỉ cần làm thay đổi nhẹ tốt hơn 3 % như Virgil Abloh)
- Đặc biệt là scale data (mở rộng dữ liệu) lên thật nhiều
Ví dụ như bào báo CLIP , whisper đều là mô hình mới nhất , có thể từ một nhóm nghiên cứu ở standford và cậu này sẽ dùng nhiều data gấp 10 lần cho con AI đó học và đi kèm một số chỉnh đổi và done
(Ở trong cách học Miracle of Incremental của mình , có 1 luận điểm mình nghĩ về thiên tài , các bạn ko cần trở thành thiên tài nghĩ ra cái mới, chỉ cần hiểu được thiên tài , cái họ làm ra được là rất tuyệt vời rồi)
quãng thời gian thất bại kéo dài từ sau bài báo DC GAN 2015 , lạc vào Reinforcement learning rồi nở rộ nhỏ ở bài báo 2018 về Amazon Sentiment Analysis (3 năm thất bại với rất nhiều ý tưởng, nhưng mỗi lần thất bại , ta sẽ lại mạnh hơn và nở rộ ở bài báo GPT), giới nghiên cứu có người đánh cược chỗ để đi nghiên cứu cách làm sâu hơn : về kiến trúc mạng neuron, về tiền xử lí data, về sự đa dạng data, Alec đã đặt cược vào học sâu và việc scale data sau nhiều ván cược nhầm vị trí nhưng đầy sự học hỏi sau đó. Nghe thì đơn giản nhưng đọc báo rồi bạn mới hiểu , bạn cần hiểu được những phát minh người tiền nhiệm thì mới sáng tạo được (đây là 1 ý trong cách học Higher Abstract Consolidation của mình)
Làm việc 2 mình :
cậu ấy luôn có 1 người làm cùng , cực kì giỏi (ko nhất thiết là 1 người), làm khoa học nên làm 2 người thay vì 3 người , lý do ở bài viết về Alec mình từng có nói. Mình đã từng làm AI viết báo được vào Q1 cùng 1 người em K65 Bách khoa. 2 người is perfect.
1 bài thuyết trình của Alec mà mình mất tiêu video hiếm đó , rất hiếm nhưng đây là slide ấn tượng nhất mình từng cóp được
giải thích 2 slide trên
slide 1
Alec phát hiện 1 hệ thống AI muốn cải tiến có thể bet vào 3 điểm
kiến trúc , thuật toán tối ưu và dữ liệu
cuối cùng dùng kiến trúc xịn, dùng thuật toán tối ưu tốt và cách học unsupervised learning hoặc self-supervised learning chính là đáp án - theo mình là vậy và cuối cùng gấp triệu lần số lượng data lên tăng khả năng generalize của model
mình biết có nhiều từ bạn nhăn mặt ko hiểu nhưng tin mình , nó đơn giản đến kì lạ nếu bạn đưa vào chatgpt hỏi
slide 2
mình dịch vì nó tự speak for itself phết
câu hỏi tự đặt ra :
chúng ta có thể làm gì ngay hôm nay ?
cái gì thực tiễn , mang lại kết quả ?
Cái gì có thể làm cùng với những phát minh hiện tại?
Cái gì có thể nâng cao những phát minh của nhà nghiên cứu khác?
Chú ý : đừng nghĩ về 1 giải pháp hoàn hảo , tuyệt đối đúng (ý nôm na là cứ tiến từng bước nhỏ thôi , kiểu gi cũng tìm được đường , ko theo chủ nghĩa hoàn hảo)
trùm lý thuyết về mảng Representation learning
AI hay deep learning (1 nhánh quan trọng: học sâu) là cho 1 mô hình toán học thật nhiều dữ liệu để nó tinh chỉnh tham số qua nhiều vòng lặp để có thể thực hiện những tác vụ con người thường làm được (Ví dụ suy nghĩ, quét biển số, suy luận toán Olympics)
Cậu này là trùm lý thuyết về mảng Representation learning. Các nhà nghiên cứu AI giống như 4 nhà ở Hogwart vậy , có vô số kỹ thuật , hay chính là spell của nhiều pháp sư. Sẽ có người chuyên sâu về Computer Vision hay NLP , thậm chí có giáo sư mình đọc và biết rất rất giàu, trong hơn 12 năm , nghiên cứu duy nhất về dáng đi , gait recogntion. (kiểu theo dõi thay vì khuôn mặt thì là dáng đi vậy). Alec tuy ko phải dân chuyên âm thanh , ngôn ngữ tự nhiên (NLP) hay thậm chí LLMs nhưng cậu dùng phép thuật chuyên sâu về self supervised , weakly supervised learning và auto-regressive và representation learning và đánh bại những bài toán AI đó cả 3 mảng
Ok, có vẻ nghe hơi ảo ma tí nhưng nghe khá thú vị từ góc nhìn mình.
Dưới đây là nguồn để bạn tham khảo thêm về Alec:
Youtube : L11 Language Models -- guest instructor: Alec Radford (OpenAI) --- Deep Unsupervised Learning SP20
Video siêu hiếm chưa tìm được :< chứa slide trên
5. Tản mạn cuối bài
1 chút tản mạn về phương pháp học và làm việc:
Đối với mình có 3 lí do chính dựa vào 3 kỹ năng học tập ở mức cao mình tự đặt tên
- Miracle of Incremental
- Boredom Embrace
- Higher Abstract Consolidation & Creativity
Các kỹ thuật như Pomodoro , Active learning , … mình sẽ để ở mức bình dân (các phương pháp học tập sau sẽ cần thời gian tự trải nghiệm và mỗi người tự rút ra được), các kỹ thuật cao được khai phá như First Principle Think , Beginner mindset , Orcam Razor ... cũng rất hay
Các phương pháp học này mình sẽ viết sau nhưng sẽ để đây để khơi dậy sự tò mò của độc giả =) Riêng Boredom Embrace mình đã viết ở bài trước gần đây.
Ok , cơm đã chín sau 40 phút. Mình kết bài ở đây (thêm 40 phút để hoàn thiện hơn) , Thanks for reading fellow human. Cảm ơn độc giả đã dành thời gian đọc đến đây ^v^
Các bài báo đề cập:
DCGAN - 2015 - Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks
Amazon Sentiment Analysis - 2017 - Learning to Generate Reviews and Discovering Sentiment
GPT 1 - 2018 - Improving Language Understandingby Generative Pre-Training
GPT 2 - 20xx- Language Models are Unsupervised Multitask Learners
CLIP - 2021 - Learning Transferable Visual Models From Natural Language Supervision
Whisper - 2022 - Robust Speech Recognition via Large-Scale Weak Supervision

Quan điểm - Tranh luận
/quan-diem-tranh-luan
Bài viết nổi bật khác
- Hot nhất
- Mới nhất
dophat2403
Dù em ko hiểu 90% bài viết của chủ thớt nói gì nhưng vẫn đọc hết :)). Sau biên tập lại thành series lịch sử AI ko chừng :)). Em đang học năm nhất DS và rất thích cách chia sẻ của anh. Ko đao to búa lớn, đi thẳng vào vấn đề và đặc biệt dùng ngôn từ rất "bình dân".
Mong anh viết nhiều bài hơn về những chủ đề technical, hoặc cũng có thể kể vài câu chuyện như trong 1 bài nào đó anh viết về 1 ông chú uống cf chung mày mò khám phá các thứ. Rất hay. Cảm ơn anh vì 1 bài viết trông rất technical khó nuốt nma đọc rất giải trí
- Báo cáo

WandererGuy
Cảm ơn em rất nhiều nha :> đi thẳng vào vấn đề và giải trí và cố gắng bình dân và technical là những điều anh muốn hướng tới 

- Báo cáo
dophat2403
Nếu được em có thể xin contact của anh để học hỏi thêm được không ạ ?
P/s: Em không phải bán khóa học hay lừa đảo hay đa cấp gì đâu ạ. Em chỉ muốn biết thêm về ngành mình đang theo đuổi thôi 😂.
- Báo cáo
dophat2403
Nếu được em có thể xin contact của anh để học hỏi thêm được không ạ ?
P/s: Em không phải bán khóa học hay lừa đảo hay đa cấp gì đâu ạ. Em chỉ muốn biết thêm về ngành mình đang theo đuổi thôi 😂.
- Báo cáo

WandererGuy
oki em , inb nhé , anh cũng ko bán khoá học hay rủ đi cam chơi đâu :))
- Báo cáo