728x90 반응형 SMALL ai에이전트5 Anthropic 하네스 설계 번역 요약: 장기 실행 앱 개발에서 평가자 에이전트가 중요한 이유 한눈에 보기공개 시점: Anthropic Engineering, 2026년 3월 24일핵심 주장: frontier agentic coding의 성능은 모델만이 아니라 harness design이 크게 좌우가장 중요한 구조: planner -> generator -> evaluator 3단 분리와 반복 피드백프런트엔드 실험: 미적 품질도 기준을 잘게 쪼개면 반복 개선이 가능장기 실행 코딩 실험: context reset, sprint contract, Playwright QA가 완성도 차이를 만듦실무 결론: 모델이 좋아질수록 하네스는 무작정 더 복잡해지는 것이 아니라 필요한 부분만 남기는 방향으로 다시 설계돼야 함서론2026년 3월 24일, Anthropic Engineering은 Harness desig.. 2026. 3. 26. 이전 1 2 3 4 5 다음 728x90 반응형 LIST