Câu chuyện về Anthropic - Gã khổng lồ A.I giá trị 1000 tỷ đô

Hãy nhìn những gì đang diễn ra trong lĩnh vực trí tuệ nhân tạo dạo gần đây: Claude – "đứa con cưng" của Anthropic đang thể hiện sự vượt trội hoàn toàn. Các phiên bản mới nhất cho thấy năng lực suy luận mạnh mẽ và tư duy tốt hơn hẳn so với các đối thủ cạnh tranh. Claude giờ đây có thể tự di chuyển chuột, thao tác phần mềm, viết mã nguồn và làm việc độc lập như một người đồng nghiệp thực thụ. Thậm chí, Claude Fable 5 còn bị Chính Phủ Mỹ buộc ngừng hoạt đồng vì lo ngại an ninh quốc gia về an toàn bảo mật.

Thế còn lĩnh vực tài chính thì sao? Tất cả đang chờ đợi đợt phát hành cổ phiếu ra công chúng của Anthropic dự kiến diễn ra ngay trong năm 2026 này. Công ty đang có mức định giá được đồn đoán sẽ chạm ngưỡng 1.000 tỷ USD. Nước Mỹ sẽ lại có thêm một tập đoàn trên nghìn tỷ đô, ngay sau sự kiện “lên sàn” của SpaceX dạo gần đây.

Tuy nhiên, khi bỏ qua tất cả những tin tức thu hút đó để nhìn vào bản chất, CEO Dario Amodei và các cộng sự đã và đang tạo ra những bước chuyển biến đột phá trong ngành AI. Họ dùng chính những tiêu chuẩn an toàn để ép AI phải tự tư duy sắc bén hơn, thay vì chỉ là một cỗ máy học vẹt trị giá vài tỷ đô.

Giờ đây, khi trí tuệ nhân tạo càng ngày càng tự chủ, những vấn đề mới sẽ bắt đầu phát sinh. Liệu triết lý đạo đức và bảo vệ con người mà Anthropic theo đuổi liệu có đủ sự vững vàng trong cuộc đua AI liên quan tới công nghệ, tài chính và cả các sắc lệnh chính trị?

I. Ngành A.I trước khi Anthropic xuất hiện

Trước khi ChatGPT tạo ra bước ngoặt lớn trong nhận thức của công chúng vào cuối năm 2022, lĩnh vực trí tuệ nhân tạo là một ngành không quá nổi bật. Công chúng khi ấy hầu như chẳng hiểu A.I thực chất là gì. Một số người coi A.I là thuật toán gợi ý của Netflix, trình phát nhạc ngẫu nhiên của Spotify, nhận diện khuôn mặt trên smartphone hoặc qua một số cảnh phim viễn tưởng với hệ thống Skynet trong series Kẻ Hủy Diệt. Giới nghiên cứu học thuật thì luôn giữ thái độ thận trọng sau những giai đoạn trầm lắng vì thiếu hụt kinh phí nghiên cứu trong quá khứ. Đó là quãng thời gian mà nhiều người gọi là "Mùa đông AI".

Suốt nhiều năm, giới khoa học tin rằng: Để AI có thể thực sự bắt kịp năng lực tư duy của con người, chúng ta cần một cuộc cách mạng toàn diện về thuật toán và những đột phá về toán học. Tuy nhiên, tại Thung lũng Silicon, một sự thay đổi đã âm thầm diễn ra.

Lúc này, nguồn lực nghiên cứu AI không nằm trong tay các startup nhỏ lẻ, mà thuộc về các khu thí nghiệm được hậu thuẫn bởi dòng vốn từ các tập đoàn công nghệ như Google Brain, DeepMind, Meta AI và một tổ chức nghiên cứu có tên OpenAI. Các ông lớn này chạy đua với nhau để tạo ra trí thông minh nhân tạo. Nhưng rồi, một phát hiện mới đã khiến cả ngành AI phải thay đổi kế hoạch: Đó là “Định luật Tỷ lệ - Scaling Laws”. Định luật này gồm các nguyên lý mô tả hiệu suất của các hệ thống AI tăng lên một cách có thể dự đoán được khi tăng ba yếu tố chính gồm: kích thước mô hình, lượng dữ liệu huấn luyện và tài nguyên tính toán.

Và rất nhanh sau đó, định luật Tỷ Lệ đã nhanh chóng được chứng minh qua sự ra đời của GPT-2 vào năm 2019 và đặc biệt là siêu mô hình GPT-3 vào năm 2020 do OpenAI phát triển. Với 175 tỷ tham số – quy mô chưa từng có vào thời điểm bấy giờ, GPT-3 cho thấy khi một mô hình ngôn ngữ lớn đạt đến một ngưỡng nhất định, nó không chỉ đơn thuần làm nhiệm vụ "khớp mẫu" hay dự đoán từ ngữ. Nó bắt đầu bộc lộ những năng lực mới.

Không cần phải tinh chỉnh cho từng tác vụ cụ thể, GPT-3 đã tự có khả năng dịch thuật, viết luận văn logic, lập trình mã code và làm toán. Lần đầu tiên, giới công nghệ nhìn thấy một lối đi rõ ràng dẫn đến “Trí tuệ Nhân tạo Tổng quát - Artificial General Intelligence”. Hóa ra, chúng ta không cần những đột phá toán học nào cả, thứ AI cần là sức mạnh của các trung tâm dữ liệu. Tuy nhiên, "Định luật Tỷ lệ" đi kèm với một bài toán tài chính cực lớn. Việc phát triển và huấn luyện những mô hình khổng lồ yêu cầu hạ tầng điện toán bao gồm hàng chục ngàn vi xử lý đồ họa hoạt động hết công suất, tiêu tốn lượng điện bằng cả một thành phố nhỏ khoảng vài trăm nghìn dân.

Chi phí huấn luyện giờ đây không dừng ở mức vài triệu đô, mà nhanh chóng leo thang lên hàng tỷ đô la. Cuộc chơi AI vượt ra khỏi tầm quy mô đầu tư mạo hiểm. Giờ đây, nếu các doanh nghiệp muốn tham gia và tồn tại trong lĩnh vực này, nó đòi hỏi nguồn vốn dồi dào. Các phòng thí nghiệm AI bắt buộc phải liên kết chặt chẽ với các siêu tập đoàn nắm giữ hạ tầng như Microsoft, Google, và Amazon.

Chính áp lực kinh tế khổng lồ đã buộc OpenAI phải từ bỏ sứ mệnh phi lợi nhuận từ những ngày đầu. Năm 2019, cái bắt tay 1 tỷ USD với Microsoft đã giúp họ giải quyết vấn đề tài chính, nhưng đồng thời, đây cũng là thời điểm bắt đầu cho một cuộc mâu thuẫn nội bộ. Khát vọng thương mại hóa và áp lực chiếm lĩnh thị trường dần lấn át mục tiêu vì nhân loại ban đầu.

Cùng lúc đó, các hệ thống AI bắt đầu bộc lộ rủi ro hệ thống. Đặc biệt, vấn đề đảm bảo AI luôn tuân theo lợi ích con người vẫn đang đi vào ngõ cụt. Đối với một nhóm các nhà nghiên cứu cốt lõi tại OpenAI, việc phát hành các mô hình mạnh mẽ khi chưa giải quyết triệt để rủi ro là một hành động mà họ coi là nguy hiểm. Sự rạn nứt này đã dẫn đến cuộc thoái lui lớn trong đội ngũ của OpenAI. Nhóm chuyên gia cao cấp đặt nặng tính an toàn đã quyết định rời đi, đặt nền móng đầu tiên cho sự ra đời của chủ thể mà chúng ta sẽ bàn luận kỹ hơn trong các phần tiếp theo - tập đoàn Anthropic.

II. Dario Amodei và hành trình đến với A.I

Nếu Thung lũng Silicon vốn luôn nổi bật bởi những CEO mang phong thái ngôi sao, thu hút mọi luồng tranh luận của truyền thông như Jeff Bezos, Elon Musk và luôn tuân theo một tôn chỉ duy nhất là "tăng trưởng bùng nổ", thì Dario Amodei lại trái ngược hoàn toàn. Thế nên, để hiểu được Anthropic và định hướng của tập đoàn này, chúng ta hãy cùng tìm hiểu về hành trình đến với AI của vị CEO này. Dario không xuất thân từ một trường kinh doanh nổi tiếng nào. Ông là một nhà khoa học bị thôi thúc bởi những động lực có tính cá nhân.

1. Động lực từ câu chuyện cá nhân

Sinh ngày 1 tháng 1 năm 1983 tại San Francisco, Dario lớn lên trong một gia đình bình thường và không có nhiều thứ đồ công nghệ hào nhoáng trong quãng thời gian tuổi thơ. Thế giới quan và triết lý làm việc của ông được đúc kết từ người cha gốc Ý – một thợ thủ công đồ da luôn đòi hỏi sự chính xác tỉ mỉ, và người mẹ làm quản lý dự án tại thư viện – người giúp ông định hình tư duy hệ thống và khả năng sắp xếp cấu trúc thông tin.

Tuy nhiên, cuộc đời của chàng thanh niên Dario đã rẽ sang một hướng đi hoàn toàn khác vào năm 2006, khi cha ông đột ngột qua đời vì một căn bệnh hiểm nghèo. Bi kịch mất người thân vốn là câu chuyện của mọi gia đình, nhưng điều thực sự để lại vết sẹo tâm lý cho Dario lại đến sau đó. Chỉ bốn năm sau ngày cha ông qua đời, giới y khoa đã công bố một phương pháp điều trị đột phá, giúp giảm tỷ lệ tử vong của chính căn bệnh đó từ 50% xuống chỉ còn 5%.

Khoảng trống bốn năm chậm trễ để lại trong tâm trí Dario nhiều chiêm nghiệm về yếu tố "tính cấp thiết". Tại sao các đột phá y khoa lại mất nhiều thời gian đến vậy? Ông nhận ra rằng, khát vọng rút ngắn quá trình nghiên cứu y sinh từ chỗ phải mất hàng thập kỷ xuống chỉ còn vài năm hoặc vài tháng không thể nào chỉ dựa vào sức người nghiên cứu. Đó chính là động lực đưa ông đến chuyên ngành Khoa học máy tính và Trí tuệ nhân tạo.

2. Quá trình học thuật và phát triển

Không ai có thể phủ nhận trí tuệ của Dario. Ở tuổi 16, ông đã đại diện nước Mỹ tham dự kỳ thi Olympic Vật lý Quốc tế. Tiếp đó, ông học tập trong lĩnh vực sinh học tại đại học Caltech và Stanford, trước khi xuất sắc hoàn thành tấm bằng Tiến sĩ ngành Lý sinh và Khoa học thần kinh tính toán tại Đại học Princeton.

Bước ngoặt trong sự nghiệp của vị tiến sĩ trẻ diễn ra vào năm 2014, khi ông quyết định tham gia nghiên cứu và làm việc cho phòng thí nghiệm AI của Baidu tại Thung lũng Silicon. Dưới sự dẫn dắt của Andrew Ng – Chủ tịch của Coursera, người rất am hiểu của ngành AI hiện đại, Dario được tham gia vào dự án nhận diện giọng nói Deep Speech 2. Thế nhưng, khoảng thời gian gắn bó với gã khổng lồ công nghệ Trung Quốc này không chỉ nâng tầm chuyên môn mà còn mang đến cho ông những trăn trở sâu sắc.

Môi trường làm việc tại Baidu đã cho ông cơ hội tận mắt chứng kiến cách một quốc gia như Trung Quốc có thể khai thác triệt để quyền lực dữ liệu và phớt lờ mọi ranh giới về quyền riêng tư ra sao. Đây cũng là lý do cho việc Dario Amodei luôn lên tiếng việc ủng hộ chính phủ Mỹ ban hành lệnh cấm vận chip sang Trung Quốc.

Tuy nhiên ở Baidu, bằng tư duy phân tích tỉ mỉ và chính xác, ông đã quan sát, chứng minh và hệ thống hóa: "Giả thuyết Tỷ lệ - Scaling Hypothesis” – tiền thân của “Định luật Tỷ lệ - Scaling Laws”.

Việc nhận ra rằng năng lực của các mạng nơ-ron nhân tạo có thể được dự báo chính xác bằng các công thức toán học là một khoảnh khắc quan trọng đối với riêng Dario và toàn ngành AI nói chung. Chỉ cần nạp vào lượng dữ liệu lớn và sức mạnh điện toán khổng lồ, trí thông minh của AI sẽ tăng trưởng theo một quỹ đạo có thể tính toán được. Nhận thức này đã làm thay đổi hoàn toàn tư duy nghiên cứu của ông và định hướng phát triển của ngành A.I sau này.

3. Thời kỳ tại OpenAI

Sau một thời gian ngắn mài giũa tại Google Brain, Dario gia nhập OpenAI vào tháng 7 năm 2016 và nhanh chóng vươn lên vị trí Phó Chủ tịch Nghiên cứu. Tại đây, cùng với nhà khoa học máy tính Ilya Sutskever, Dario trở thành kiến trúc sư trưởng định hướng nền tảng kỹ thuật cho toàn bộ tổ chức. Chính tay ông đã trực tiếp dẫn dắt quá trình phát triển của các siêu mô hình gây tiếng vang khắp thế giới là GPT-2 và GPT-3.

Tuy nhiên, khi hệ thống càng lớn, sức mạnh của AI càng dễ vượt khỏi tầm kiểm soát của con người. Vậy nên, Dario đã trở thành người tiên phong phát triển phương pháp "Học tăng cường từ phản hồi của con người". Kỹ thuật này biến các mô hình ngôn ngữ lộn xộn, đôi khi có phần độc hại, trở thành những cỗ máy đối thoại lịch sự, hữu ích và an toàn hơn thông qua hàng ngàn phản hồi của những chuyên gia trong đa dạng lĩnh vực.

Dù vậy, khi GPT-3 bắt đầu bộc lộ những năng lực tự sinh – tức là tự học được những kỹ năng mà các kỹ sư chưa từng lập trình cho nó như dịch thuật, làm toán…. cái nhìn của Dario đã thay đổi. Ông và đội ngũ nghiên cứu tại Open AI nhận thức được quy mô và khả năng xoay chuyển thế giới khi các mô hình này tồn tại. Nếu công nghệ này phát triển theo hướng sai lầm và thiếu đạo đức, những vấn đề xấu có thể xảy ra.

4. Quyết định rời đi

Trong một thời gian dài, truyền thông đồn đoán rằng sự ra đi đột ngột của Dario Amodei khỏi OpenAI là do mâu thuẫn về việc chia chác lợi ích tài chính hay phản đối định hướng thương mại hóa mà công ty hướng đến. Thực tế, chính Dario đã thẳng thừng bác bỏ những điều này, bởi bản thân ông là một trong những người trực tiếp tham gia hoạt động thương mại hóa GPT-3. Việc rời khỏi Open AI vào tháng 12 năm 2020 thực chất bắt nguồn sự bất đồng về hệ tư tưởng:

- Triết lý của OpenAI đại diện bởi Sam Altman: Đậm chất Thung lũng Silicon với phương châm "Phát hành nhanh, vá lỗi sau". Họ tin rằng AI phải được đưa ra thị trường để tiếp xúc với người dùng thực tế, từ đó thu thập dữ liệu để hoàn thiện, bất chấp những rủi ro đi kèm. Chiếm lĩnh thị phần là ưu tiên số một.

- Triết lý của Dario Amodei: Lấy sự an toàn làm trung tâm tuyệt đối. Ông kịch liệt phản đối việc biến người dùng thành "chuột bạch thử nghiệm” và quả quyết rằng một hệ thống AI siêu việt không nên được phép để đến với đại chúng nếu nó chưa vượt qua các bài kiểm tra khắt khe. Các vấn đề như AI bị lợi dụng để thao túng chính trị, AI phát tán thông tin sai lệch hay hỗ trợ chế tạo vũ khí là những thông tin mà nhà phát hành sản phẩm cần phải kiểm soát.

Tưởng chừng mọi bất đồng triết lý này sẽ chấm dứt khi Dario quyết định rời OpenAI. Tuy nhiên, câu chuyện đằng sau còn phức tạp hơn thế. Trong một số phỏng vấn vào năm 2025 và 2026, ông đã kể lại quãng thời gian đấy với thái độ chỉ trích rằng "Open AI có những kiểu hành vi thiếu trung thực đáng lo ngại". Dario nhận thấy đội ngũ kỹ thuật hoàn toàn đánh mất niềm tin vào giá trị cốt lõi của những lãnh đạo. Mâu thuẫn cá nhân giữa hai bên đã leo thang gay gắt đến mức, tại một hội nghị công nghệ ở Ấn Độ, Dario và Sam Altman đã thẳng thừng từ chối nắm tay nhau trên sân khấu, bất chấp yêu cầu hàn gắn từ chính Thủ tướng Modi.

Và thế là, Dario đã rời đi cùng đội ngũ gồm những bộ óc kiệt xuất nhất của Open AI lúc đó để sau này thành lập nên Anthropic, họ bao gồm: - Daniela Amodei: Em gái Dario, nguyên Phó Chủ tịch Chính sách và An toàn. - Jack Clark: Giám đốc Chính sách. - Chris Olah: Chuyên gia số một thế giới về khả năng diễn giải cơ chế AI. - Tom Brown: Tác giả chính của tài liệu nghiên cứu mô hình GPT-3. - Jared Kaplan & Sam McCandlish: Các nhà khoa học vật lý lý thuyết, đồng tác giả của "Định luật Tỷ lệ" danh tiếng.

Chiến lược mà Dario đưa ra trong khoảng thời gian tiếp theo không phải là đứng ngoài lề và kêu gọi các công ty khác suy xét vấn đề đạo đức. Ông quá hiểu chủ nghĩa tư bản để biết rằng điều đó là vô ích. Thay vào đó, ông tập trung vào "Cuộc đua hướng tới đỉnh". Bằng cách tạo ra một hệ thống AI vừa sở hữu sức mạnh tư duy áp đảo, vừa mang độ an toàn chuẩn mực cao nhất, Dario sẽ buộc các đối thủ khác phải chạy theo bộ quy tắc đạo đức mà công ty của họ đặt ra. Từ một nhà khoa học đau đáu với bi kịch gia đình, Dario Amodei đã lột xác thành một CEO định hình lại hệ chuẩn mực cho tương lai của AI.

III. Anthropic ra đời

Tháng 12 năm 2020, giữa lúc cả thế giới đang chao đảo vì đại dịch Covid-19, Thung lũng Silicon xảy một cuộc "dứt áo ra đi" lặng lẽ. Không có họp báo rùm beng, không có những bài đăng mạng xã hội ồn ào. Dario Amodei và em gái Daniela Amodei cùng 5 nhà nghiên cứu cốt cán khác - những người thực sự đứng sau các mô hình làm chấn động giới công nghệ như GPT-2 và GPT-3, quyết định thu dọn đồ đạc rời khỏi OpenAI.

Tổ chức mới của họ – cái tên sau này sẽ trở thành đối thủ lớn khiến các ông lớn công nghệ phải dè chừng, không bắt đầu trong những phòng họp hào nhoáng. Do dịch bệnh, họ chỉ có thể trao đổi với nhau qua Zoom và những dịp ngồi ăn trưa trên bãi cỏ ở công viên Precita, San Francisco. Bảy con người ấy đang mang trong mình rất nhiều trăn trở. Họ vừa chứng minh cho cả ngành A.I thấy "Định luật Tỷ Lệ" là chính xác. Chỉ cần tiếp thêm dữ liệu và tăng sức mạnh máy chủ, AI sẽ trở nên thông minh với và xử lý tác vụ với tốc độ chóng mặt. Các tập đoàn lớn với tiềm lực tài chính khủng đã sẵn sàng nhập cuộc và vòng quay này là không thể đảo ngược.

Lúc này, câu hỏi họ đặt ra không xa vời như "Liệu AI có thông minh hơn con người không?", mà là vấn đề đang dần hiện hữu trước mắt: "Khi A.I thực sự trở thành siêu trí tuệ, ai sẽ là người điều khiển để cỗ máy đó để nó không vượt tầm kiểm soát?". Sự ra đời của Anthropic, vì thế, bắt nguồn từ ý thức trách nhiệm bảo vệ tương lai của chính nhân loại.

1. Cặp bài trùng nhà Amodei: Những người trực tiếp điều hành

Giới công nghệ thường quen với hình ảnh các startup được dẫn dắt bởi một vị CEO mang hơi hướng độc tài. Nhưng Anthropic lại được lèo lái bởi một cặp anh em có sự bù trừ năng lực hoàn hảo.

Nếu CEO Dario Amodei là một bộ óc khoa học thiên tài đặt ra tầm nhìn kỹ thuật, thì cô em gái – Chủ tịch Daniela Amodei, chính là người điều hành thiết lập các cơ chế vận hành tối ưu. Việc Daniela ngồi ghế Chủ tịch không phải là chuyện "gia đình trị". Với xuất phát điểm là dân văn học, từng tham gia chính trường, và kinh nghiệm quản lý rủi ro tại startup thanh toán tỷ đô Stripe, Daniela sở hữu một góc nhìn đúng đắn về quản trị con người.

Tại Anthropic, Daniela quản lý mọi thứ: từ tuyển dụng khắt khe, điều hành dòng tiền, đến xây dựng văn hóa công ty. Để nhận định đúng đắn nhất, Dario là người tập trung giải bài toán kỹ thuật của mô hình, còn Daniela phụ trách vấn đề tác động kinh tế và xã hội.

2. Lá chắn pháp lý và quyết định thực dụng

Tham vọng của những người sáng lập nằm ngay ở cái tên: Anthropic – bắt nguồn từ chữ "anthropos" trong tiếng Hy Lạp, nghĩa là "thuộc về con người". Ngụ ý ở đây rất rõ ràng: AI sinh ra để phục vụ nhân loại.

Để bảo vệ sứ mệnh này trước sự cám dỗ của Thung lũng Silicon, Anthropic đã đăng ký dưới dạng "Công ty Lợi ích Công cộng - Public Benefit Corporation”. Việc này cấp cho Ban giám đốc quyền pháp lý để ưu tiên lợi ích xã hội lên trên nghĩa vụ kiếm tiền nhanh cho cổ đông. Chưa dừng lại, họ còn lập thêm “Quỹ Tín thác Lợi ích Dài hạn” nhằm có quyền sử dụng cổ phiếu đặc biệt để phủ quyết nếu các nhà đầu tư ép họ tung ra sản phẩm AI chưa hoàn thiện.

Một câu chuyện khá thú vị được kể lại rằng trong những ngày tháng đầu tiên, nhóm sáng lập chỉ định mở một phòng lab nhỏ. Nhưng ngành AI không cho phép những nhà nghiên cứu có được lựa chọn "thanh cao" như vậy. Để kiểm soát các siêu AI, bạn phải là kẻ mạnh nhất, và điều đó tốn hàng tỷ đô la tiền mua chip GPU. Thế là Anthropic bẻ lái, chấp nhận hàng tỷ USD rót vốn từ Google và Amazon, lao thẳng vào đấu trường thương mại hóa.

3. Claude và cuộc cách mạng "Trí tuệ nhân tạo Lập hiến"

Dòng mô hình Claude chính là câu trả lời của Anthropic. Thay vì vội vã, họ quyết định giữ sản phẩm của mình trong phòng thí nghiệm nhiều tháng trời để kiểm tra an toàn. Phải đến tháng 3/2023, Claude mới chính thức trình làng công chúng.

Sự khác biệt cốt lõi của Claude nằm ở triết lý huấn luyện. Các ông lớn khác thường dùng con người để chấm điểm AI. Trớ trêu thay, chính Dario - người từng góp phần tạo ra phương pháp này, lại nhận ra lỗ hổng của nó: con người đầy rẫy định kiến và quá trình huấn luyện dễ sinh ra hiện tượng "xu nịnh" khiến AI nói dối để làm vừa lòng người chấm điểm.

Để vá lỗ hổng, Anthropic tạo ra “AI Lập hiến - Constitutional AI”. Thay vì dùng con người tinh chỉnh, họ cung cấp cho Claude một bộ tiêu chuẩn rành mạch, xoay quanh kim chỉ nam “Helpful, Harmless, Honest - Hữu ích, Vô hại, Trung thực” được chắt lọc từ Tuyên ngôn Quốc tế Nhân quyền của Liên Hợp Quốc và các nguyên tắc y đức. Mỗi khi trả lời, AI phải tự soi chiếu với bộ tiêu chuẩn, tự phê bình và tự sửa đổi. Claude không học vẹt, nó học được cách suy luận, từ chối lịch sự, mang lại cảm giác chuyên nghiệp và ấm áp

4. Biến đạo đức và an toàn thành “con gà đẻ trứng vàng”

Sự cẩn trọng này vô tình trở thành yếu tố cạnh tranh mà Anthropic sở hữu. Nếu ChatGPT hướng đến đại chúng với định hướng nhanh nhằm chiếm lĩnh thị trường, thì Claude nhắm đến các doanh nghiệp trong đa dạng lĩnh vực như ngân hàng, luật, y tế… nơi một câu trả lời mang yếu tố "ảo giác - hallucination” có thể dẫn đến kiện tụng hàng chục triệu đô la. Doanh nghiệp có thể chọn Claude vì độ tin cậy và khả năng bảo vệ dữ liệu.

Vậy là, Anthropic đã chứng minh cho cả thị trường A.I thấy rằng: "Bạn không cần phải bán rẻ đạo đức để kiếm tiền."

Tuy nhiên, dưới lăng kính triết học, câu chuyện này không hoàn toàn thể duy nhất một gam màu hồng. Những người chỉ trích cho rằng quyền định hình thuật toán giờ đây được chuyển dịch từ đám đông người sử dụng và huấn luyện sang nhóm nhỏ tinh hoa. Bằng việc tự tay viết ra bộ tiêu chuẩn cho cỗ máy tương tác với hàng trăm triệu người, nhóm lãnh đạo của Anthropic đang thiết lập một dạng "Quyền lực mềm", mã hóa hệ giá trị của mình vào tận DNA của một trong những cấu trúc thông minh bậc nhất thế kỷ 21.

IV. Bứt phá và khẳng định

1. Vượt qua "Thuế căn chỉnh"

Nhìn lại cục diện thị trường AI giai đoạn cuối 2022 và đầu 2023, thế giới công nghệ bùng nổ với sự kiện OpenAI tung ra ChatGPT. Tất cả các tập đoàn lớn trong lĩnh vực này sau đó bắt đầu bước vào cuộc đua giành thị phần người dùng cá nhân. Họ liên tục phát hành sản phẩm mới theo phương châm "thử nghiệm và sửa lỗi sau", chấp nhận những rủi ro liên quan đến rò rỉ dữ liệu hay hiện tượng AI bịa đặt thông tin để đổi lấy sự xuất hiện phủ khắp các mặt báo.

Giữa bối cảnh đó, Anthropic chọn một hướng khác. Dario Amodei và đội ngũ kỹ sư không định vị Claude như một trợ lý ảo đại chúng, mà xây dựng nó thành một hệ thống AI dành riêng cho môi trường doanh nghiệp. Những người đứng đầu hiểu rằng giới doanh nghiệp sẵn sàng chi trả các hợp đồng giá trị cao, nhưng đổi lại, họ yêu cầu sự chính xác, khả năng bảo mật dữ liệu nội bộ và tính ổn định. Đó đều là những yếu tố mà các mô hình nổi bật trên thị trường lúc đó chưa thể đáp ứng toàn diện.

Tuy nhiên, lựa chọn của Anthropic vấp phải một rào cản kỹ thuật được giới nghiên cứu gọi là "Thuế căn chỉnh - Alignment Tax”. Nguyên lý này chỉ ra rằng, khi nhà phát triển áp đặt quá nhiều bộ quy tắc an toàn và đạo đức, mô hình AI sẽ suy giảm năng lực tư duy. Chúng thường trở nên cứng nhắc, từ chối trả lời các câu hỏi phức tạp hoặc mất đi khả năng giải quyết vấn đề logic do bị giới hạn bởi các bộ lọc rủi ro.

Tháng 3 năm 2024, Anthropic chứng minh điều ngược lại với sự kiện ra mắt dòng mô hình Claude 3. Bằng việc ứng dụng phương pháp “AI Lập hiến - Constitutional AI” cho phép AI tự đối chiếu và điều chỉnh câu trả lời dựa trên một bộ nguyên tắc cốt lõi thay vì bị kỹ sư can thiệp thủ công, Claude 3 đã giải quyết được vấn đề giữa tính an toàn và hiệu suất. Phiên bản cao cấp nhất, Claude 3 Opus, đã vượt qua GPT-4 trên các bài kiểm tra chuẩn mực về toán học, lập trình và suy luận logic. Dario và đội ngũ của mình đã cho toàn bộ thị trường A.I thấy rằng khung an toàn không phải là rào cản, mà là nền tảng giúp AI đưa ra quyết định sắc bén hơn.

Song song với việc nâng cấp tư duy cho mô hình, Anthropic tạo nên sự khác biệt so với các đối thủ thông qua Cửa sổ ngữ cảnh (Context Window). Khả năng xử lý dữ liệu đầu vào của Claude đã được nâng lên mức 200.000 token tại sự kiện phát hành mô hình Claude 2.1. Ngưỡng này tương đương khoảng 150.000 từ trong một lần xử lý. Về mặt ứng dụng thực tế, tính năng này cho phép một công ty luật nạp hàng chục hồ sơ, hoặc một quỹ đầu tư tải lên toàn bộ báo cáo tài chính 10 năm của một doanh nghiệp để phân tích chỉ trong vài chục giây. Khả năng xử lý khối lượng lớn dữ liệu này củng cố vị thế của Anthropic trong nhóm khách hàng doanh nghiệp cần làm việc với lượng thông tin có cấu trúc phức tạp.

2. Xây dựng thương hiệu từ tệp khách hàng doanh nghiệp

Thị trường người dùng cá nhân mang lại danh tiếng nhanh chóng nhưng tỷ lệ rời bỏ cũng rất cao. Họ có xu hướng dùng thử và dễ dàng hủy đăng ký khi có một sản phẩm mới ra mắt. Nhận thức được vòng đời ngắn hạn này, chiến lược thương mại của Anthropic hướng toàn bộ nguồn lực vào khối doanh nghiệp

Chìa khóa để Anthropic bước vào các tổ chức tài chính, y tế và cơ quan nhà nước là chứng nhận FedRAMP High. Đây là tiêu chuẩn an ninh mạng nghiêm ngặt của chính phủ Mỹ áp dụng cho các nhà cung cấp điện toán đám mây. Quá trình kiểm duyệt để đạt được FedRAMP High rất mất thời gian và tốn kém, nhưng một khi sở hữu nó, Anthropic loại bỏ được rất nhiều đối thủ cạnh tranh. Các tiêu chuẩn quản trị rủi ro đã được chuyển hóa thành yếu tố giúp bảo vệ thị phần. Kết quả của chiến lược tập trung vào tệp khách hàng cao cấp này là doanh thu trung bình trên mỗi người dùng của hãng đạt mức 368 USD, vượt trội so với mức trung bình của các dịch vụ phần mềm.

Không dừng lại ở việc cung cấp quyền truy cập API, Anthropic tiến hành tái cấu trúc cách con người tương tác với AI thông qua tính năng Artifacts và Projects. Các công cụ này thay đổi giao diện sử dụng từ dạng trò chuyện thông thường sang một không gian làm việc khép kín. Người dùng có thể yêu cầu Claude viết một đoạn mã, sau đó hiển thị, chỉnh sửa và chia sẻ kết quả ngay trên cùng một màn hình.

Để giữ chân khách hàng lâu dài, Anthropic áp dụng chiến lược gia tăng chi phí chuyển đổi. Hãng đã tạo ra các cổng kết nối trực tiếp Claude vào hệ thống hạ tầng sẵn có của doanh nghiệp như GitHub, Slack hay cơ sở dữ liệu nội bộ. Một khi AI đã được tích hợp sâu vào quy trình vận hành và mã nguồn của doanh nghiệp khách hàng, việc thay thế nó bằng một nhà cung cấp khác sẽ đòi hỏi chi phí, thời gian và rủi ro gián đoạn hệ thống. Sự phụ thuộc kỹ thuật này đảm bảo tính bền vững cho các hợp đồng gia hạn dịch vụ.

3. Nghệ thuật phân mảnh rủi ro

Đằng sau các mô hình phần mềm là bài toán vật lý của ngành AI mang tên năng lực điện toán. Việc huấn luyện và vận hành các hệ thống như Claude 3 tiêu tốn hàng chục ngàn bộ xử lý đồ họa và lượng điện năng lớn. Yêu cầu phần cứng này đẩy Anthropic vào thế buộc phải huy động nguồn vốn quy mô hàng tỷ USD. Dario Amodei hiểu điều đó. Ông đã cấu trúc các thỏa thuận tài chính để nhận 8 tỷ USD từ Amazon và hơn 3 tỷ USD từ Google, đổi lại việc sử dụng hệ thống máy chủ của chính các tập đoàn này.

Giao dịch này từng gây ra những câu hỏi về tính độc lập của Anthropic khi họ phụ thuộc vào hạ tầng của các công ty công nghệ lớn. Tuy nhiên, cách Amodei triển khai sản phẩm đã biến điểm yếu này thành chiến lược "Hạ tầng trung lập"

Anthropic không cam kết phân phối độc quyền. Họ đưa Claude lên cả ba nền tảng đám mây gồm: AWS của Amazon, Google Cloud và Microsoft Azure. Bằng cách cho phép khách hàng sử dụng Claude trên bất kỳ nền tảng đám mây nào họ đang có sẵn, Anthropic tự định vị mình là một lớp phần mềm trung gian, độc lập với các cuộc chiến hạ tầng máy chủ.

Qua từng bước đi, từ kiến trúc phần mềm, phương pháp tiếp cận khách hàng đến cách cấu trúc các thỏa thuận tài chính, Anthropic đã thiết lập một hệ sinh thái kinh doanh có tính phòng thủ cao. Công ty này chứng minh rằng trong một ngành công nghiệp được thúc đẩy bởi tốc độ, sự tính toán cẩn trọng và cách tiếp cận đi vào bản chất vấn đề, mọi thứ đều hoàn toàn có thể trở thành phương thức tạo ra biên lợi nhuận và vị thế vững chắc, không cần phải đánh đổi đạo đức.

V. Đồng nghiệp kỹ thuật số

Bước sang năm 2026, cuộc đua trí tuệ nhân tạo toàn cầu đã thay đổi rất nhiều so với chỉ với năm trước. Các mô hình ngôn ngữ lớn không còn đóng vai trò là những cỗ máy trả lời câu hỏi thụ động, mà phát triển thành các "Đồng nghiệp kỹ thuật số". Anthropic dẫn đầu quá trình chuyển giao này khi trang bị cho dòng Claude 4 và 4.5 tính năng "Năng lực thực thi hành động". Về mặt kỹ thuật, Claude giờ đây có khả năng tự động di chuyển chuột, đọc hiểu giao diện màn hình và vận hành các phần mềm độc lập giống hệt một nhân sự thực thụ.

Sức mạnh thực thi này được thể hiện bằng nền tảng thông số vượt trội. Cửa sổ ngữ cảnh trên dòng Claude 4.6 chạm mốc 1 triệu token, đi kèm với tỷ lệ giải quyết thành công các vấn đề phần mềm đạt kỷ lục 80.9% trên bảng xếp hạng chuẩn mực SWE-bench. Công cụ lập trình Claude Code tạo doanh thu khổng lồ trong phân khúc doanh nghiệp. Các tập đoàn công nghệ sẵn sàng chi trả chi phí lớn để tự động hóa quy trình viết mã, đẩy doanh thu định kỳ của Anthropic chạm ngưỡng 2,5 tỷ USD và đưa mức định giá của công ty lên con số 965 tỷ USD.

Tuy nhiên, khi AI chuyển từ trạng thái "tư vấn" sang "tự chủ hành động", một vấn đề khác lại nảy sinh. Các nhà nghiên cứu phát hiện ra rằng, các lỗi logic của AI giờ đây có thể trực tiếp biến thành các lỗ hổng an ninh mạng thực tế, như việc tự động cài cắm mã độc hay vô tình mở các cửa hậu (backdoor) trong hệ thống của doanh nghiệp.

Đáng chú ý hơn, ngành công nghiệp AI đang bước vào một chu kỳ khép kín: Có tới 70-90% khối lượng mã nguồn dùng để huấn luyện các thế hệ mô hình mới đang do chính các phiên bản Claude tiền nhiệm tự viết ra. Quá trình này khiến nhân loại lùi bước, nhường chỗ cho máy móc chạm đến ngưỡng "Tự nâng cấp” — nơi AI tự thiết kế ra phiên bản thông minh hơn của chính nó. Để duy trì quyền kiểm soát, đội ngũ của Dario Amodei buộc phải kích hoạt hệ thống "Khả năng diễn giải cơ học - Mechanistic Interpretability”, soi chiếu vào hệ thống nhằm dự báo và can thiệp trước khi mô hình chạm đến các ngưỡng rủi ro.

Mặc dù đã trang bị những vòng bảo vệ phức tạp như vậy, các nguyên tắc đạo đức của Anthropic bắt đầu có dấu hiệu rạn nứt trước áp lực tài chính. Sức ép từ mức định giá tiệm cận 1.000 tỷ USD cùng với các các hóa đơn thuê máy chủ điện toán đám mây khổng lồ mỗi tháng đã đẩy ban lãnh đạo công ty vào thế phải đánh đổi.

Đầu năm 2026, giới quan sát công nghệ phát hiện Anthropic đã âm thầm điều chỉnh lại bộ chính sách an toàn cốt lõi. Cam kết tạm dừng hoàn toàn quá trình phát triển khi phát hiện rủi ro mức độ cao đã bị gỡ bỏ, thay thế bằng một cơ chế "trì hoãn" với các điều khoản nới lỏng hơn. Xét trên góc độ kinh doanh, đây là một quyết định dễ hiểu. Tự trói tay mình bằng các quy chuẩn đạo đức cứng nhắc trong khi các đối thủ cạnh tranh đang tăng tốc phát hành sản phẩm là một chiến lược sai lầm khi lĩnh vực AI thay đổi rất nhanh. Nếu Anthropic tụt lại phía sau và cạn kiệt nguồn vốn, họ sẽ mất đi quyền lực định hình các tiêu chuẩn an toàn cho toàn ngành.

Sự thỏa hiệp này tạo ra một hiệu ứng domino. Để duy trì quỹ đạo tăng trưởng, Anthropic mở cửa đón nhận các dòng vốn đầu tư lớn từ các quỹ tài sản quốc gia khu vực Trung Đông — một động thái đi ngược lại với sự cẩn trọng ban đầu của Dario Amodei về việc duy trì tính trung lập. Vấn đề kinh tế của các mô hình có quy mô lớn đã cho thấy rằng: để thiết kế ra một hệ thống AI đủ tốt và đủ đạo đức, Anthropic bắt buộc phải trở thành tổ chức nắm giữ nguồn lực lớn nhất. Và để đạt được vị thế độc tôn đó, họ phải vận hành theo đúng các quy luật tối đa hóa lợi nhuận mà họ từng muốn tránh xa.

VI. Sự đứt gãy với Lầu Năm Góc

Ngay đầu năm 2026, mối lương duyên giữa các doanh nghiệp AI tư nhân và cơ cấu quyền lực của chính phủ bắt đầu xảy ra nhiều xung đột. Khi trí tuệ nhân tạo trở nên quá mạnh mẽ và chạm vào những vấn đề nhạy cảm về quốc phòng, mọi rào cản đạo đức của doanh nghiệp sẽ lép vế hoàn toàn trước sức ép của của giới cầm quyền. Sự rạn nứt này bắt đầu lộ rõ từ hợp đồng trị giá 200 triệu USD giữa Anthropic và Lầu Năm Góc - một thương vụ cho thấy mô hình Claude có sức ảnh hưởng lớn ra sao với các tác vụ quốc phòng an ninh vĩ mô. Quân đội Mỹ muốn tối đa hóa hiệu suất tác chiến bằng cách yêu cầu gỡ bỏ các rào cản kiểm soát an toàn và đạo đức để khai thác toàn diện công nghệ trong các tình huống thực địa. Tuy nhiên, CEO Dario Amodei đã thẳng thừng từ chối nhằm bảo vệ hai giá trị cốt lõi của công ty gồm: không ứng dụng AI vào các hệ thống vũ khí và không biến hệ thống thành công cụ giám sát công dân.

Khi xung đột xảy ra và hai bên chẳng hề có dấu hiệu tích cực nào, chính phủ Mỹ quyết định tấn công bằng sắc lệnh trừng phạt khi đưa Anthropic vào danh mục rủi ro chuỗi cung ứng đối với an ninh quốc gia, đồng thời cấm hoàn toàn các cơ quan liên bang giao dịch với tổ chức này. Cùng với đó, Lầu Năm Góc nhanh chóng chuyển dịch toàn bộ gói ngân sách sang cho đối thủ thương mại OpenAI. Anthropic cũng chẳng kém cạnh, lập tức phản đòn bằng việc đâm đơn kiện chính phủ Mỹ vào tháng 3 năm 2026. Đây là một hành động pháp lý cực kỳ hiếm hoi trong lịch sử công nghệ. Thế nhưng, cuộc chiến ranh giới đạo đức mới chỉ là màn dạo đầu.

Căng thẳng chính thức đẩy lên đỉnh điểm vào ngày 9 tháng 6 năm 2026, khi Anthropic chính thức phát hành siêu mô hình Claude Fable 5. Đây là phiên bản thương mại của lớp mô hình Mythos 5 - thứ sở hữu năng lực tự chủ và phân tích an ninh mạng chuyên sâu ở mức siêu việt. Lãnh đạo Anthropic kiên quyết bảo vệ quan điểm rằng việc trì hoãn phát hành lớp mô hình Mythos trước đó hoàn toàn không phải là chiêu trò truyền thông. Thực tế, các kiểm tra kỹ thuật cho thấy Mythos đã tự phát hiện ra tới 271 lỗ hổng bảo mật chưa từng được biết đến của chính nó trên trình duyệt FireFox. Do đó, Anthropic buộc phải tiếp tục chỉnh sửa mô hình này trước khi tung ra công chúng. Chính năng lực vượt trội này của Fable 5 đã khiến giới chức trách nhìn nhận mô hình này như một dạng "vũ khí kỹ thuật số" nguy hiểm, chứ không phải một phần mềm thương mại thuần túy.

Chỉ ba ngày sau, vào tối ngày 12 tháng 6 năm 2026, Cục Công nghiệp và An ninh thuộc Bộ Thương mại Mỹ phối hợp cùng Nhà Trắng ban hành chỉ thị kiểm soát khẩn cấp. Cơ quan quản lý quốc gia đã buộc Anthropic phải dừng ngay quyền truy cập dòng mô hình mới đối với tất cả cá nhân mang quốc tịch nước ngoài – bao gồm cả những người cư trú hợp pháp sở hữu thẻ xanh tại Mỹ – trong khung thời gian giới hạn vỏn vẹn 90 phút.

Quyết định can thiệp bất ngờ này từ chính phủ Mỹ xuất phát từ hai nỗi lo. Đầu tiên, các cơ quan tình báo phát hiện các nhóm tin tặc nước ngoài đang cố gắng bẻ khóa hàng rào an toàn của Fable 5 nhằm khai thác lỗ hổng từ mô hình. Thứ hai, và cũng là nguyên nhân chủ yếu nhất dẫn đến lệnh cấm khẩn cấp 90 phút, chính là nguy cơ các quốc gia khác đang sử dụng phương pháp “chưng cất mô hình - model distillation” – một kỹ thuật "học lỏm" thuật toán cho phép một mô hình nhỏ hơn học tập và sao chép cấu trúc trí thông minh của mô hình lớn với chi phí cực rẻ. Giới chức Mỹ hiểu rằng nếu để đối thủ nước ngoài chưng cất thành công Fable 5, các đối thủ sẽ dễ dàng rút ngắn khoảng cách công nghệ, từ đó đe dọa trực tiếp và phá vỡ thế độc quyền công nghệ của Mỹ chỉ trong một thời gian ngắn.

Sau khi nhận quyết định, Anthropic rơi vào thế tiến thoái lưỡng nan. Họ hoàn toàn không có khả năng xác thực quốc tịch của hàng triệu tài khoản người dùng qua giao thức API trên toàn cầu trong vòng 90 phút. Vậy nên, để tránh các chế tài hình sự liên bang, giải pháp duy nhất là Anthropic phải tự tay ngừng hoạt động hoàn toàn dòng mô hình mạnh nhất của mình trên phạm vi toàn cầu, điều hướng lưu lượng truy cập của người dùng trở lại phiên bản cũ Opus 4.8.

Nếu nhìn sâu xa hơn, việc Mỹ ra quyết định khẩn cấp như vậy cho thấy các mô hình AI đang dần biến thành một thứ hàng hoá chiến lược, có tầm quan trọng chẳng khác gì đất hiếm hay dầu mỏ. Sự kiện Fable 5 không chỉ là một thiệt hại tài chính đối với Anthropic, mà còn cho thấy rằng trong kỷ nguyên trí tuệ nhân đang phát triển nhanh chóng, quyền tự quyết của giới tinh hoa Thung lũng Silicon đã không còn. Mọi quyết định của họ đều phải đi kèm với các toan tính địa chính trị phức tạp của chính phủ. Vậy thì, tuyên ngôn đạo đức của Anthropic liệu có còn đủ vững vàng nếu các yếu tố này can thiệp?

VII. Lời kết

Anthropic quả thật đã chứng minh cho cả thế giới thấy đạo đức và sự cẩn trọng hoàn toàn có thể song hành cùng thành công thương mại. Họ đã cho thấy giới doanh nghiệp sẵn sàng chi trả những khoản tiền rất lớn cho sự an toàn. Thế nhưng, liệu Anthropic có thể tiếp tục thành công mà vẫn giữ vững được triết lý đạo đức của họ trong thời gian tới, nhất là khi thời điểm IPO 1000 tỷ USD dự kiến sẽ xảy ra vào nửa sau của năm 2026 này.

Nếu định nghĩa thành công là một bản báo cáo tài chính với lợi nhuận tỷ đô và những siêu mô hình dẫn đầu thị trường, họ chắc chắn đã làm được và sẽ duy trì được điều đó. Nhưng nếu thành công là giữ vững được lằn ranh đạo đức thuần túy trước sức ép của dòng vốn tư bản và các vấn đề địa chính trị, thì câu chuyện lại trái ngược hoàn toàn. Lịch sử công nghệ từng cho chúng ta thấy những phát minh vĩ đại nhất luôn có xu hướng vượt khỏi vòng tay của người tạo ra chúng, nhất là khi nó liên quan đến an ninh và chính trị.

Câu chuyện của Anthropic trong tương lai để lại cho chúng ta những suy nghĩ. Liệu loài người có thể thực sự kiểm soát được một trí tuệ có khả năng tự phát triển? Khi AI không còn là một công cụ mà dần trở thành người bạn đồng hành, những bộ quy tắc đạo đức của Thung lũng Silicon liệu có đủ sức bảo vệ người dùng?

Có lẽ, câu trả lời không nằm ở những dòng code hay các thuật toán phức tạp. Trí tuệ nhân tạo, suy cho cùng, chỉ là những phản chiếu những tham vọng, nỗi sợ hãi và cả giới hạn của chính con người chúng ta. Câu chuyện của Anthropic vẫn đang được viết tiếp, và hồi kết thực sự vẫn còn đang chờ đợi ở phía trước.

Công nghệ mới