Hermes 자기검진 파이프라인 구축기

Hermes Agent에는 명시적인 “자기 반성(self-reflection)” 기능이 없다. 사람이 직접 시스템을 점검하고, 스킬을 정리하고, 메모리를 최적화해야 한다. 그런데 사람이 깜빡하면 시스템은 방치된다. 그래서 이 작업을 Hermes가 스스로 하게 만들기로 했다.

문제 정의

당시 내 Hermes 시스템은 50개 이상의 스킬, 30개의 크론 작업, 꽉 찬 메모리(98%)로 돌아가고 있었다. 시스템은 잘 동작했지만 상태를 한눈에 파악하기 어려웠다. 새 스킬을 만들 때마다 기존 스킬과 중복되는지 확인해야 하고, 더 이상 안 쓰는 크론이 있는지, 메모리에 오래된 정보가 쌓이고 있지 않은지 — 이 모든 걸 수동으로 확인하는 건 비효율적이다.

접근 과정

처음에는 세 개의 크론으로 분리하는 방안을 제안했다. Cron A는 일일 프로파일 점검(크론 상태, 시스템 부하), Cron B는 주간 스킬 리뷰(중복/낡은 스킬 식별), Cron C는 주간 KB 확장(Wiki 노트 자동 생성)이었다.

각각의 크론이 하나의 관심사에 집중하고, 결과도 각각의 Discord 채널로 분산해서 전달하는 구조였다. 하지만 피드백은 간단했다: “반복 패턴 싫어. 하나로 합쳐.” 결국 세 개를 통합한 단일 크론, “Hermes Ops”가 탄생했다. 3일 간격으로 실행되며, 모든 점검 결과를 하나의 Discord 포럼 스레드(#hermes-meta)로 보낸다.

실제 동작

통합 크론은 다음과 같은 작업을 순차적으로 수행한다:

스킬 디렉토리 스캔 — 스킬 목록과 최종 수정일 확인
크론 목록 조회 — 모든 크론의 상태, 최근 실행 시간, 실패 이력 확인
메모리 사용률 확인 — 현재 메모리 점유율, 만료 가능한 항목 추천
시스템 리소스 — CPU, 메모리, 디스크 사용량 수집
3일간의 세션 요약 — 최근 주요 활동과 결정 사항 정리

모든 결과는 하나의 메시지로 포맷되어 Discord hermes-meta 채널로 전달된다.

한계

자기검진 시스템도 결국 자기 자신을 개선하지는 못한다. “너의 X 스킬이 낡았다”는 리포트는 할 수 있지만, 실제로 그 스킬을 업데이트하는 건 사람의 결정이 필요하다. 가장 중요한 자기개선 루프(Improve yourself based on review)는 아직 자동화되지 않았다. 이는 에이전트가 스스로를 수정하는 것이 위험할 수 있기 때문이기도 하다 — 실수로 중요한 시스템 설정을 건드릴 위험이 있다.

하지만 적어도 이제는 Hermes가 자신의 상태를 “보고”하는 채널이 생겼다. 3일에 한 번씩, 시스템이 어떤 상태인지 한눈에 파악할 수 있는 리포트가 자동 생성된다. 이걸로도 충분한 출발이다.