Sự thay đổi lớn nhất của AI Agent không nằm ở việc làm cho AI thông minh hơn, mà nằm ở việc xây dựng hệ thống xung quanh AI tốt hơn. AI vẫn rất quan trọng, nhưng điều tạo ra khác biệt thật sự là khi AI có thể kết nối dữ liệu, sử dụng công cụ, ghi nhớ thông tin, xử lý công việc theo từng bước và phối hợp với các hệ thống khác. Nói đơn giản, không chỉ nâng cấp bộ não của AI mà còn nâng cấp cả môi trường để AI làm việc hiệu quả hơn. Chỉ trong 4 năm, cách phát triển AI Agent đã tiến hóa qua 3 giai đoạn rõ rệt như sau:

Giai đoạn 1: Weights (2022)
Mọi thứ khi đó đều xoay quanh chính mô hình. Mô hình lớn hơn, nhiều dữ liệu hơn, cách huấn luyện tốt hơn. Các quy luật mở rộng (scaling laws) cho rằng tiến bộ sẽ đến từ việc tăng thêm số lượng tham số.
RLHF và fine-tuning là những yếu tố giúp định hình hành vi của mô hình trong giai đoạn này.
Nếu bạn muốn có một AI agent tốt hơn, bạn sẽ huấn luyện ra một mô hình tốt hơn. Cách này hoạt động rất hiệu quả với các tác vụ một lượt hỏi – một lượt trả lời.
Nhưng nó nhanh chóng gặp giới hạn, muốn cập nhật chỉ một thông tin cũng phải huấn luyện lại. Việc kiểm tra và đánh giá hành vi gần như không thể. Và cá nhân hóa cho hàng triệu người dùng chỉ với một bộ trọng số (weights) cố định thì đã không xảy ra.
Giai đoạn 2: Context (2023-2024)
Một điều quan trọng được nhận ra trong giai đoạn này là bạn không phải lúc nào cũng cần sửa hay huấn luyện lại mô hình. Thay vào đó, bạn chỉ cần thay đổi thông tin đầu vào mà mô hình được nhìn thấy. Prompt engineering, few-shot examples, chain-of-thought và RAG là những phương pháp nổi bật dẫn đầu giai đoạn này.

Bất ngờ là cùng một mô hình AI đã được giữ nguyên nhưng nó có thể phản hồi rất khác nhau chỉ nhờ vào thông tin bạn đưa cho nó trước khi hỏi.
Các developer vì thế không còn tập trung fine-tuning quá nhiều nữa, mà chuyển sang thử nghiệm và tối ưu prompt, cùng hệ thống lấy dữ liệu liên quan đưa vào cho AI. Cách này rẻ hơn, nhanh hơn và hiệu quả hơn nhiều người nghĩ.
Nhưng vẫn có giới hạn. Bộ nhớ ngữ cảnh (context window) không phải vô hạn. Prompt quá dài sẽ dễ rối và lẫn thông tin. AI cũng không chú ý đều hết mọi phần, thường bỏ sót nội dung nằm ở giữa đoạn dài (đó là vấn đề “lost in the middle”).

Và mỗi phiên làm việc mới đều bắt đầu lại từ đầu, không nhớ gì về những gì đã xảy ra trước đó. Context giúp AI agent linh hoạt hơn nhưng nó chưa khiến AI trở nên đáng tin cậy.
Giai đoạn 3: Harness engineering (2025-2026)
Đây chính là giai đoạn chúng ta đang ở hiện tại.

Câu hỏi giờ đã thay đổi từ “chúng ta nên nói gì với mô hình?” thành “chúng ta nên đặt mô hình vào môi trường làm việc như thế nào?”
Mô hình không còn là nơi duy nhất chứa trí thông minh nữa. Nó giờ hoạt động bên trong một hệ thống gồm: bộ nhớ lâu dài, kỹ năng có thể tái sử dụng, các giao thức tiêu chuẩn (như MCP và A2A), môi trường thực thi an toàn, các bước phê duyệt và lớp theo dõi/giám sát hoạt động.

Mô hình vẫn giữ nguyên, điều thay đổi là nhiệm vụ mà nó được giao để giải quyết.
Ví dụ: một coding agent được yêu cầu xây dựng tính năng mới, chạy test và tạo PR.
Nếu không có harness, mô hình phải tự ghi nhớ mọi thứ trong một prompt khá mong manh: cấu trúc source code, quy ước dự án, trạng thái công việc và cách dùng công cụ.
Nếu có harness, thì bộ nhớ lâu dài sẽ cung cấp ngữ cảnh, các file kỹ năng sẽ lưu quy ước làm việc, giao diện chuẩn hóa sẽ đảm bảo dữ liệu đúng cấu trúc, còn môi trường chạy sẽ sắp xếp các bước và xử lý lỗi.
Vì vậy, vẫn là cùng một mô hình, nhưng độ ổn định và độ tin cậy hoàn toàn khác nhau.
Mô hình phát triển qua 3 giai đoạn rất rõ ràng:
- Weights: kiến thức được lưu trong tham số của mô hình (nhanh nhưng cứng nhắc).
- Context: kiến thức được đưa vào prompt (linh hoạt nhưng tạm thời).
- Harnesses: kiến thức được tách ra thành hạ tầng bên ngoài, có bộ nhớ và quy trình rõ ràng (đáng tin cậy và dễ quản lý).
Mỗi giai đoạn không thay thế giai đoạn trước, mà xây dựng thêm trên nền tảng đã có.
Weights vẫn quan trọng, context engineering vẫn cần thiết. Nhưng trọng tâm giờ đã dịch chuyển ra bên ngoài mô hình.
Những cải tiến quan trọng nhất giúp AI agent đáng tin cậy hơn ngày nay hiếm khi đến từ việc thay đổi mô hình gốc.
Chúng thường đến từ việc:
- Truy xuất bộ nhớ tốt hơn
- Nạp kỹ năng chính xác hơn
- Kiểm soát quá trình thực thi chặt chẽ hơn
- Quản lý dung lượng context thông minh hơn
Nói cách khác, xây AI agent tốt hơn ngày nay ngày càng đồng nghĩa với việc xây một môi trường tốt hơn để mô hình hoạt động trong đó.
Tham khảo khóa học Ứng dụng AI tại ĐÂY& Liên hệ ngay với CyberSoft để được tư vấn lộ trình đào tạo “may đo” dành riêng cho doanh nghiệp của bạn!




