2. 인공지능 논문리뷰/Agent AI

[논문추천] Agent-as-a-Judge: Evaluate Agents with Agents

First man 2025. 3. 7. 02:21
728x90
반응형
SMALL

 

안녕하세요,

 

오늘은 IITP 토론토대학교 인공지능 파견 간 기업프로젝트도 함께 진행하고 있는데요.

 

저는 LG Toronto Agent AI Project를 맡게 되었습니다.

 

Coursework 기간에는 2주에 한번씩 미팅을 진행하고 있습니다.

 

미팅 간 담당자분께서 추천해주셨던 Agent 논문 링크 공유드립니다.

 

 

 

[Meta의 Agent-as-a-Judge: Evaluate Agents with Agents]

https://arxiv.org/abs/2410.10934

 

Agent-as-a-Judge: Evaluate Agents with Agents

Contemporary evaluation techniques are inadequate for agentic systems. These approaches either focus exclusively on final outcomes -- ignoring the step-by-step nature of agentic systems, or require excessive manual labour. To address this, we introduce the

arxiv.org

 

Submission history
[v1] Mon, 14 Oct 2024 17:57:02 UTC 
[v2] Wed, 16 Oct 2024 17:54:12 UTC 

728x90
반응형
LIST