Litecoin

Tôm hùm đã là quá khứ? Sắp xếp các công cụ của Đại lý Hermes giúp bạn làm việc hiệu quả hơn gấp 100 lần

2026/04/14 00:12
🌐vi

Bạn càng sử dụng nó lâu, nó càng trở nên thông minh hơn. Hermes có gì đặc biệt mà các nhà phát triển đã chuyển sang?

Tôm hùm đã là quá khứ? Sắp xếp các công cụ của Đại lý Hermes giúp bạn làm việc hiệu quả hơn gấp 100 lần

Vào ngày 25 tháng 2, một nhóm có tên Nous Research đã âm thầm đẩy phiên bản 0.1.0 lên GitHub. Mẫu Hermes đời đầu chỉ có một dòng lệnh lắp đặt và một câu định vị sản phẩm: “Một đại lý cùng phát triển với bạn”.

Rất ít người để ý đến điều đó vào thời điểm đó. Mặc dù Nous Research đã có danh tiếng nhất định trong giới người mẫu, nhưng loạt người mẫu Hermes của họ đã tích lũy được 33 triệu lượt tải xuống trên HuggingFace, nhưng sự chú ý của toàn bộ cộng đồng nhà phát triển lại đổ dồn vào "tôm càng" OpenClaw được tôn sùng như một vị thần. Nó đã vượt qua React để trở thành ứng dụng đầu tiên trong lịch sử sau 33 ngày. "Crayfish" trở thành dự án tăng trưởng nhanh nhất trong lịch sử GitHub, với đỉnh điểm là 710 sao/giờ. Tuy nhiên, tại thời điểm này, các nhà nghiên cứu bảo mật tiếp tục tiết lộ các lỗ hổng bảo mật với tốc độ trung bình 2,2 CVE mỗi ngày trong cùng khoảng thời gian, với tổng số 138 lỗ hổng bảo mật trong 63 ngày. Toàn bộ cộng đồng bắt đầu suy nghĩ lại một câu hỏi: Thứ này có thể sử dụng được trong môi trường sản xuất không?

Trong bối cảnh đó, Hermes Agent, cũng là một sản phẩm cạnh tranh, cuối cùng cũng có cơ hội tận dụng và mở ra thời kỳ tăng trưởng thần tốc đầu tiên.

Hermes đã viết công cụ di chuyển bằng một cú nhấp chuột từ OpenClaw sang mã riêng của mình. Các nhà phát triển đã rời OpenClaw cần một nơi để ở, và Hermes Agent đã trở thành một lựa chọn tốt qua lời truyền miệng.

Như vậy bắt đầu từ đầu tháng 3, Hermes Agent đã lọt vào GitHub Trending, đạt đỉnh cao ở vị trí thứ 11, với số lượng sao vượt quá 2.200. AwesomeAgents gọi đây là "bản phát hành Đại lý nguồn mở đầy tham vọng nhất tính đến thời điểm hiện tại vào năm 2026". Hiện tại, github của Hermes có 69,9k Sao và 9k Fork.

Hôm nay, Rhythm BlcokBeats sẽ nói chuyện với bạn về điểm khác biệt của Đặc vụ này.

Đại lý Hermes là gì?

Đặc vụ Hermes là một đặc vụ AI tự phát triển được xây dựng bởi Nous Research. Đây hiện là Đại lý duy nhất có vòng khép kín học tập tích hợp.

Nó có thể tự động tạo ra các kỹ năng từ trải nghiệm sử dụng, liên tục cải thiện các kỹ năng này trong quá trình sử dụng, tích cực củng cố kiến ​​thức thành tài sản có thể sử dụng lại, truy xuất lịch sử trò chuyện trong quá khứ của bạn và liên tục hiểu sâu hơn về bạn với tư cách là người dùng qua nhiều phiên.

Nói một cách đơn giản, ưu điểm lớn nhất của Hermes Agent là: bạn càng sử dụng nó, nó càng thông minh hơn và bạn càng sử dụng nó thì nó càng trở nên dễ dàng hơn.

Định vị của nó không phải là một trợ lý lập trình được gói trong IDE, cũng không phải là sự đóng gói trò chuyện của một API duy nhất, mà là một Tác nhân tự trị thực sự cư trú trên máy chủ của bạn, có thể ghi nhớ những gì nó đã học và sẽ trở nên mạnh mẽ hơn khi nó hoạt động lâu hơn.

Nous Research ngay từ đầu đã định vị mình là phòng thí nghiệm AI phi tập trung, ưu tiên nguồn mở, với mục tiêu xây dựng AI mà người dùng có thể kiểm soát độc lập, thay vì tập trung trí tuệ vào tay một số công ty đóng cửa. Công việc ban đầu của họ tập trung vào loạt mẫu xe Hermes, đồng thời đầu tư mạnh vào cơ sở hạ tầng và cấp độ hệ thống. Họ cũng khám phá công nghệ DisTrO để đào tạo mô hình trên các GPU tiêu dùng được phân phối trên toàn cầu, cũng như môi trường mô phỏng cho tương tác đa tác nhân và hành vi tầm xa như WorldSim và Doomscroll.

Nhóm Đặc vụ Hermes cũng chính là nhóm người đã tạo ra hàng loạt mô hình như Nomos và Psyche.

Một số công cụ hữu ích là gì?

Cơ chế cốt lõi của Đặc vụ Hermes là hệ thống trí nhớ và hệ thống kỹ năng. Tác nhân duy trì hai tệp cốt lõi được sắp xếp hợp lý: MEMORY.md lưu trữ thông tin, quy ước và kinh nghiệm về môi trường được tóm tắt từ các nhiệm vụ trước đây; USER.md lưu trữ các sở thích và phong cách giao tiếp của bạn. Hai tệp này được tự động đưa vào lời nhắc của hệ thống vào đầu mỗi phiên, tương đương với "bộ nhớ làm việc dài hạn" của Tác nhân. Ngoài ra, tất cả các cuộc hội thoại lịch sử đều được lưu trữ trong cơ sở dữ liệu tìm kiếm toàn văn bản SQLite, cho phép Tác nhân truy xuất các cuộc hội thoại cách đây nhiều tuần.

Trong Theo thuật ngữ của hệ thống kỹ năng, mỗi khi hoàn thành một nhiệm vụ phức tạp (thường là hơn 5 lệnh gọi công cụ), Tác nhân sẽ độc lập tạo một "tài liệu kỹ năng" Markdown có cấu trúc để ghi lại các bước thao tác, nội dung đã biết và phương pháp xác minh để sử dụng lại trong tương lai. Các tệp kỹ năng tuân theo mô hình tiết lộ lũy tiến: Theo mặc định, Đặc vụ chỉ xem tên và mô tả kỹ năng (khoảng 3000 mã thông báo) và chỉ tải nội dung đầy đủ của kỹ năng khi cần để kiểm soát mức tiêu thụ mã thông báo.

Ở cấp độ công cụ, Hermes Agent có hơn 40 công cụ tích hợp, bao gồm tìm kiếm trên web, tự động hóa trình duyệt, hiểu hình ảnh, tạo hình ảnh và chuyển văn bản thành giọng nói. Nó cũng hỗ trợ thiết lập các tác vụ theo lịch trình thông qua ngôn ngữ tự nhiên, cho phép Tác nhân tự động thực hiện các tác vụ định kỳ như tạo báo cáo, sao lưu dữ liệu và giám sát hệ thống mà không cần giám sát.

Những công cụ phổ biến nhất trong số đó là những công cụ được người dùng trong cộng đồng có tần suất sử dụng thực tế cao nhất và nhận được nhiều phản hồi nhất. Theo kiến ​​trúc chức năng của Hermes và nhu cầu điển hình của cộng đồng nhà phát triển, những công cụ này được xếp hạng đầu tiên:

Hindsight hiện là công cụ đơn phổ biến nhất trong hệ sinh thái và là plug-in bộ nhớ dài hạn được Hermes chính thức khuyên dùng. Nó tự động gọi lại bối cảnh có liên quan trước mỗi lệnh gọi LLM, hỗ trợ triển khai đám mây hoặc PostgreSQL cục bộ và đã được tích hợp vào Hermes với tư cách là Nhà cung cấp bộ nhớ gốc.

Anthropic-Cybersecurity-Skills là gói kỹ năng Stars cao nhất trong hệ sinh thái. Nó chứa hơn 753 kỹ năng bảo mật mạng có cấu trúc, ánh xạ đầy đủ khung MITER ATT&CK và phù hợp cho các tình huống nghiên cứu bảo mật và thử nghiệm thâm nhập.

mission-control hiện là bảng thông tin điều phối Tác nhân phổ biến nhất trong hệ sinh thái. Nó hỗ trợ quản lý nhóm Đại lý, phân bổ nhiệm vụ, theo dõi chi phí và quy trình làm việc hợp tác giữa nhiều Đại lý. Nó được cộng đồng khuyến nghị làm cấu hình tiêu chuẩn để triển khai ở cấp độ sản xuất.

Hermes Agent Self-Evolution là một công nghệ tự cải tiến mang tính tiến hóa sử dụng DSPy + GEPA để tối ưu hóa các kỹ năng, mẹo và mã.

Hermes Workspace là không gian làm việc riêng của Hermes, tích hợp giao diện trò chuyện, thiết bị đầu cuối và trình quản lý kỹ năng, đồng thời là lối vào đồ họa phổ biến nhất.

Ngoài ra, nó cũng có thể tạo ra các Tác nhân phụ độc lập, mỗi tác nhân có ngữ cảnh hội thoại, thiết bị đầu cuối độc lập và tập lệnh Python RPC riêng, từ đó hiện thực hóa một quy trình song song với chi phí ngữ cảnh bằng 0.

Về tính linh hoạt của cơ sở hạ tầng, sáu phần phụ trợ của thiết bị đầu cuối được hỗ trợ: chạy cục bộ, Docker, SSH từ xa, Daytona serverless, bộ chứa Singularity và chức năng đám mây Modal. Daytona và Modal ngủ khi không hoạt động với chi phí gần như bằng không. Bạn có thể chạy nó trên cụm VPS hoặc GPU trị giá 5 USD, đưa ra hướng dẫn qua Telegram và để nó hoạt động trên máy chủ đám mây mà bạn không bao giờ SSH trực tiếp vào.

Hermes Agent hiện đang cạnh tranh trực tiếp nhất với OpenClaw. Cả hai đều là khung Tác nhân nguồn mở dành cho nhà phát triển.

Triết lý kiến ​​trúc của cả hai hoàn toàn khác nhau: cốt lõi trong thiết kế của OpenClaw là một "mặt phẳng điều khiển", một quy trình thống nhất chạy dài hạn chịu trách nhiệm quản lý các phiên, định tuyến, thực thi và trạng thái công cụ, đồng thời mọi thứ đều chảy qua bộ điều khiển trung tâm này. Hermes lấy chu trình thực thi của chính Tác nhân làm cốt lõi và xây dựng cổng, bộ lập lịch thời gian, thời gian chạy công cụ, v.v. xung quanh chu trình "làm, học hỏi và cải tiến" lặp đi lặp lại này.

Sự khác biệt giữa cả hai đặc biệt đáng kể ở hệ thống kỹ năng: Các kỹ năng của OpenClaw hầu hết được viết và tải thủ công từ các cấp độ khác nhau như không gian làm việc, cá nhân, chia sẻ hoặc plug-in; Ý tưởng của Hermes là để Đặc vụ tạo ra các kỹ năng từ kinh nghiệm của chính mình, hình thành một vòng khép kín học tập thực sự tự chủ.

Cách cài đặt và sử dụng

Bắt đầu cực kỳ dễ dàng. Lệnh một dòng "curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash" có thể hoàn tất quá trình cài đặt. Nó hỗ trợ Linux, macOS và WSL2. Hermes Agent sẽ tự động hoàn tất mọi cấu hình mà không cần thao tác thủ công.

Trang web chính thức của Hermes

Sau khi quá trình cài đặt Hermes Agent hoàn tất, hãy chạy "hermes setup" để khởi chạy trình hướng dẫn, chọn nhà cung cấp mô hình của bạn (hỗ trợ Nous Portal, OpenRouter, OpenAI hoặc bất kỳ điểm cuối tùy chỉnh nào), kết nối với nền tảng nhắn tin của bạn (Telegram, Discord, Slack hoặc WhatsApp) và bắt đầu cuộc trò chuyện đầu tiên của bạn. Ngay từ lần tương tác đầu tiên, Đặc vụ Hermes ngay lập tức chuyển sang chế độ học tập và bắt đầu xây dựng ký ức, tạo ra các kỹ năng, trở nên có năng lực hơn sau mỗi buổi học.

The core commands used daily include:

hermes (start a conversation),

hermes model (select LLM provider and model),

hermes tools (configure which tools are enabled),

hermes gateway (start the message gateway, connect to Telegram, Discord and other platforms),

hermes setup (run the complete setup wizard, configure everything at once),

hermes claw migrate (di chuyển từ OpenClaw),

hermes update (cập nhật lên phiên bản mới nhất),

hermes doctor (chẩn đoán vấn đề);

Hermes Agent phù hợp với các tình huống bao gồm: trợ lý AI đa năng cần ghi nhớ bối cảnh qua các phiên và liên tục cải thiện khả năng; quy trình làm việc của Tác nhân tùy chỉnh yêu cầu kết hợp các công cụ, phần bổ trợ, máy chủ MCP, trình duyệt hoặc hệ vỏ; được triển khai trên phần cứng cục bộ, máy ảo đám mây hoặc Cơ sở hạ tầng không có máy chủ chi phí thấp; và các kịch bản trợ lý liên tục yêu cầu duy trì lịch sử hội thoại có thể tìm kiếm và các kỹ năng đã học trên các nền tảng.

Cụ thể hơn, bạn có thể sử dụng nó để thực hiện các tác vụ trên máy ảo đám mây trong khi nói chuyện với nó trên Telegram, thiết lập tự động hóa và đẩy báo cáo lên bất kỳ nền tảng nào, để nó đảm nhận các tác vụ định kỳ; bạn cũng có thể kết nối nó với Slack hoặc Discord để cung cấp hỗ trợ cộng tác AI cho toàn nhóm; hoặc sử dụng chức năng xuất quỹ đạo của nó để tạo dữ liệu huấn luyện cho việc huấn luyện RL cho các mô hình gọi công cụ thế hệ tiếp theo.

QQlink

无加密后门,无妥协。基于区块链技术的去中心化社交和金融平台,让隐私与自由回归用户手中。

© 2024 QQlink 研发团队. 保留所有权利.