OpenAI giới thiệu bộ công cụ tạo AI Agent: AI Agent SDK

OpenAI giới thiệu bộ công cụ tạo AI Agent? AI Agent SDK là gì? Trí tuệ nhân tạo (AI) đang ngày càng trở thành một phần quan trọng trong cuộc sống và công việc của chúng ta.

Mới đây, OpenAI đã giới thiệu một bộ công cụ mạnh mẽ mang tên AI Agent SDK, giúp các nhà phát triển dễ dàng tạo ra và quản lý các tác nhân AI (AI agents) có khả năng thực hiện những nhiệm vụ phức tạp và tự động hóa công việc hiệu quả.

Với bộ công cụ này, OpenAI không chỉ cung cấp những giải pháp đơn giản như Chat Completions API mà còn mở rộng khả năng tương tác, cho phép các tác nhân AI truy cập và xử lý dữ liệu thực tế một cách linh hoạt. Hãy cùng khám phá cách AI Agent SDK có thể thay đổi cách chúng ta học tập, làm việc và sáng tạo trong kỷ nguyên số.

OpenAI vừa cho ra mắt công cụ mới để xây dựng agent với API – AI Agent SDK

Ngày hôm qua, 11/3, đội ngũ Open AI, dẫn đầu bởi Kevin – trưởng nhóm sản phẩm, đã tổ chức một sự kiện công bố loạt công cụ mới cùng API “nâng cấp” dành cho các nhà phát triển.

OpenAI vừa cho ra mắt công cụ mới để xây dựng agent với API

Nếu bạn từng nghĩ về những trợ lý thông minh có thể tự làm việc, tìm tài liệu, điều khiển máy tính, những công cụ mới hoàn toàn đáp ứng được bạn. Hãy cùng ngolongnd.net tìm hiểu những công cụ này có gì đặc biệt!

Responses API – “ngôi sao” mới của Open AI

Đây là một API mới, kết hợp sự đơn giản của Chat Completions với khả năng sử dụng công cụ của Assistants API. Responses API giúp các nhà phát triển sử dụng nhiều tính năng như tìm kiếm web, tập tin, tính toán mượt mà chỉ với 1 lần gọi API.

API này cũng mang lại nhiều cải tiến về trải nghiệm sử dụng, bao gồm thiết kế dựa trên mục thống nhất, đa hình đơn giản hơn, sự kiện phát trực tuyến trực quan và các tiện ích SDK như `response.output_text` để dễ dàng truy cập đầu ra văn bản của mô hình.

Hiện công cụ đã sẵn cho tất cả các nhà phát triển và không tính phí riêng. Token và công cụ sẽ được tính theo mức giá tiêu chuẩn được chỉ định trên trang giá OpenAI.

Ba công cụ “đột phá” xây dựng agents tích hợp trong Responses AI

Không chỉ nói suống, Open AI tung ngay ba công cụ tích hợp sẵn để giúp nhà phát triển xây dựng các agent. Nó bao gồm: Web Search Tool, File Search Tool,  và Computer Use Tool.

Web Search Tool

Đây là công cụ tìm kiếm kiếm web tích hợp, lấy thông tin mới nhất và trả lời chính xác. Nó chính là “bộ não” đằng sau ChatGPT Search, khả dụng với mô hình GPT-4o hoặc 4o Mini hoặc với lệnh gọi hàm.

Javascript

const response = await openai.responses.create({

    model: "gpt-4o",

    tools: [ { type: "web_search_preview" } ],

    input: "What was a positive news story that happened today?",

});

console.log(response.output_text);

Trong bài kiểm tra SimpleQA, mô hình thử nghiệm GPT‑4o và GPT‑4o mini đạt điểm lần lượt là 90% và 88% về khả năng trả lời chính xác các câu hỏi ngắn gọn và mang tính thực tế. Đây được coi là mức điểm top đầu hiện nay.

Web Search Tool sẽ là công cụ tìm kiếm web phù hợp tác vụ như trợ lý mua sắm, tác nhân nghiên cứu thị trường hay đặt vé du lịch. Đây là những tác vụ đòi hỏi thông tin chính xác và kịp thời từ internet.

Một ví dụ điển hình là Hebbia, công ty đã tận dụng công cụ này để giúp các nhà quản lý tài sản, công ty vốn cổ phần tư nhân và văn phòng luật khai thác thông tin giá trị từ các tập dữ liệu lớn. 

File Search Tool

Nếu như bạn đang có một kho tài liệu cần khai thác, đây sẽ là thứ giúp ích cho bạn. Đây không phải công nghệ mới nhưng được nâng cấp với hai tính năng: lọc siêu dữ liệu (metadata filtering). Bạn sẽ tìm đúng thứ bạn cần, và tìm kiếm trực tiếp qua kho vector mà không cần qua mô hình trung gian. Và chỉ cần một vài dòng mã với Responses API, là có thể tích hợp công cụ này

Javascript

const productDocs = await openai.vectorStores.create({

    name: "Product Documentation",

    file_ids: [file1.id, file2.id, file3.id],

});

const response = await openai.responses.create({

    model: "gpt-4o-mini",

    tools: [{

        type: "file_search",

        vector_store_ids: [productDocs.id],

    }],

    input: "What is deep research by OpenAI?",

});

console.log(response.output_text);

File Search Tool tìm kiếm tệp tin có thể được sử dụng cho nhiều trường. Nó có thể hỗ trợ nhân viên hỗ trợ khách hàng dễ dàng truy cập các câu hỏi thường gặp (FAQ), hỗ trợ tác nhân lập trình truy vấn tài liệu kỹ thuật,…

Công cụ này hiện đã khả dụng trong Responses API và Assistants API.  Chi phí sử dụng được tính là $2,50 cho mỗi nghìn truy vấn.

Computer Use Tool

Tự động hóa, điều khiển máy tính từ xa chính là những khả năng nổi bật của công cụ này. Nó được hỗ trợ bởi mô hình CUA – được tích hợp trong Operator. Cũng chỉ cần một vài dòng lệnh với Responses API, bạn đã có thể tích hợp công cụ này.

Javascript

const response = await openai.responses.create({

    model: "computer-use-preview",

    tools: [{

        type: "computer_use_preview",

        display_width: 1024,

        display_height: 768,

        environment: "browser",

    }],

    truncation: "auto",

    input: "I'm looking for a new camera. Help me find the best one.",

});

console.log(response.output);

Mô hình CUA đã đạt được những thành tích ấn tượng trong việc tự động hóa các tác vụ máy tính phức tạp.

Mô hình CUA đã đạt được những thành tích ấn tượng trong việc tự động hóa

Bắt đầu từ hôm nay, công cụ Computer Use sẽ được cung cấp dưới dạng bản xem trước nghiên cứu trong Responses API , dành cho các nhà phát triển thuộc các tầng sử dụng từ 3 đến 5. Chi phí sử dụng được tính là $3/1 triệu token đầu vào và $12/1 triệu token đầu ra.

Agents SDK – trợ thủ cho các nhà phát triển

Ngoài bộ cung cụ, nhà phát triển còn cần điều phối các luồng công việc phức tạp giữa nhiều agent. Đó cũng chính là khả năng của Agents SDK – bộ công cụ mã nguồn mở mới. Đây là phiên bản nâng cấp vượt trội của Swarm. Agents SDK hoạt động tốt với cả Responses API và Chat Completions API.

Agents SDK có những điểm gì mới ?

  • Agent dễ tùy chỉnh: Tạo agent với hướng dẫn rõ ràng và tích hợp sẵn công cụ như Web Search.
  • Handoff thông minh: Chuyển giao nhiệm vụ giữa các agent mượt mà – ví dụ, từ agent mua sắm sang agent hỗ trợ hoàn tiền.
  • Guardrails an toàn: Kiểm soát đầu vào/đầu ra để tránh lỗi hoặc nội dung không mong muốn.
  • Tracing & Observability: Xem chi tiết từng bước agent hoạt động, dễ dàng debug và tối ưu hiệu suất.

Ví dụ, chỉ vài dòng code, bạn đã có một hệ thống agent phân loại, mua sắm, và hỗ trợ:

Python
from agents import Agent, Runner, WebSearchTool, function_tool

@function_tool

def submit_refund_request(item_id: str, reason: str):

    return "success"  # Logic hoàn tiền của bạn ở đây

support_agent = Agent(

    name="Support & Returns",

    instructions="Bạn là agent hỗ trợ, xử lý yêu cầu hoàn tiền...",

    tools=[submit_refund_request],

)

shopping_agent = Agent(

    name="Shopping Assistant",

    instructions="Bạn là trợ lý mua sắm, tìm kiếm trên web...",

    tools=[WebSearchTool()],

)

triage_agent = Agent(

    name="Triage Agent",

    instructions="Chuyển người dùng đến agent phù hợp.",

    handoffs=[shopping_agent, support_agent],

)

output = Runner.run_sync(

    starting_agent=triage_agent,

    input="Giày nào hợp với outfit của tôi nhỉ?",

)

Kết luận

OpenAI đang từng bước hiện thực hóa tuyên bố: “Năm 2025 sẽ là năm của hành động”. AI không chỉ hiểu ngôn ngữ mà còn thao tác được với thế giới vật lý. Với những công cụ được công bố, doanh nghiệp sẽ sở hữu một “đội quân” agents thông minh, hoạt động 24/7 để phục vụ khách hàng, tối ưu vận hành và sáng tạo giá trị đột phá.

Hãy bắt đầu khám phá Responses API ngay hôm nay và chia sẻ trải nghiệm của bạn cho ngolongnd.net biết nhé!

Có thể bạn quan tâm:

Giới thiệu Blog

Sống chậm lại - nghĩ khác đi - yêu thương nhiều hơn

Chào các bạn, tôi là Ngô Hải Long – CEO của công ty Giải pháp số LBK.

Tôi chuyên cung cấp dịch vụ SEO website, quảng cáo Google, Facebook, Zalo cùng với việc phát triển website WordPress và các ứng dụng di động IOS, Android. Blog này được tạo ra nhằm chia sẻ những kiến thức bổ ích về cuộc sống, thủ thuật máy tính, công việc và tài liệu miễn phí, giúp các bạn dễ dàng tiếp cận với những thông tin hữu ích.

Mặc dù đội ngũ biên soạn luôn cố gắng đảm bảo nội dung chất lượng, nhưng không thể tránh khỏi những thiếu sót hoặc sự trùng lặp với các blog khác. Nếu có bất kỳ vấn đề nào, mong các bạn thông cảm và vui lòng liên hệ với chúng tôi qua email: ngolonglbk@gmail.com.

Cảm ơn các bạn đã theo dõi và đồng hành cùng blog của chúng tôi!

Liên hệ quảng cáo- mua back link tại đây hoặc thông báo website với Bộ Công Thương

(function($) { $(document).ready(function() { $('header .ux-search-submit').click(function() { console.log('Moew'); $('header form.search_google').submit(); }); }); })(jQuery);