
OpenHands vs Devin vs Manus의 짧은 결론: 명확한 승자는 없으며, 셋 중 하나는 더 이상 독립 회사가 아닙니다. Meta는 Manus(모회사: Butterfly Effect)를 20억 달러 이상으로 평가되는 거래에서 2025년 12월 30일경 인수했습니다. 따라서 당신의 진정한 질문은 "어떤 것이 최고인가"가 아닙니다. "내 가장 큰 제약에 맞는 것은 무엇인가"입니다. All Hands AI의 OpenHands는 오픈소스 선택지입니다. Cognition의 Devin은 월 $20~$500의 턴키형 유료 엔지니어입니다. Manus는 전체 앱을 만듭니다. 과대광고가 아닌 제약으로 선택하세요.
이 셋은 모두 자율형 코딩 에이전트이지만 동일한 게임을 하지 않습니다. OpenHands는 오픈소스이며 자체 호스팅 가능합니다(MIT, 무료 실행, Claude와 함께 ~72% SWE-bench Verified). Devin은 Cognition의 자동 엔지니어입니다(ACU 기반, 월 $20~$500). Manus는 이제 Meta 자산인 범용 앱 빌더입니다. 제어를 위해 OpenHands를, 위임을 위해 Devin을, 전체 앱 생성을 위해 Manus를 선택하세요.
빠른 평가:
- OpenHands: 오픈소스, 자체 호스팅, 무료 실행(모델 API 비용만 지불); Claude와 함께 ~72% SWE-bench Verified. 제어를 위해 선택하세요.
- Devin: Cognition의 턴키형 유료 엔지니어; 월 $20~$500, ACU 기반; 가장 높은 자동 자율성. 위임을 위해 선택하세요.
- Manus: 범용 앱 빌더, 크레딧 기반; 2025년 12월 Meta에 인수됨. 단, 주의사항이 있으면서 엔드투엔드 앱 생성을 위해 선택하세요.
- 보편적 승자는 없습니다. 당신의 가장 큰 제약에 따라 달라집니다: 제어, 자동 자율성, 또는 전체 앱 생성.
빠른 평가: 이 셋 중 어떤 것을 선택해야 할까요?
OpenHands, Devin, Manus는 세 가지 자율형 AI 코딩 에이전트입니다. OpenHands는 오픈소스이며 자체 호스팅 가능합니다(무료, MIT, Claude와 함께 ~72% SWE-bench Verified). Devin은 Cognition의 턴키형 유료 엔지니어입니다(월 $20~$500, ACU 기반). Manus는 이제 Meta가 소유한 범용 앱 빌더입니다. 제어를 위해 OpenHands를, 자동 자율성을 위해 Devin을, 전체 앱 생성을 위해 Manus를 선택하세요.
그렇다면 실제로는 어떻게 선택할까요? 가장 큰 제약에서 시작하면 답이 나옵니다:
- OpenHands를 선택하세요. 제어를 원한다면: 자체 호스팅, 자신의 모델, 사용자당 락인 없음, 그리고 오픈소스 중 가장 높은 SWE-bench 점수.
- Devin을 선택하세요. 전체 작업을 위임하고 거의 개입하지 않으려면. Jira, Linear, Slack이 연결되어 있어 세 개 중 가장 자동화된 것입니다.
- Manus를 선택하세요. 저장소 수정이 아닌 엔드투엔드 전체 앱(데이터베이스, 결제, 배포)을 빌드하려면. 다만 Meta 로드맵의 불확실성을 먼저 검토하세요.
보편적 승자는 없습니다. 올바른 자율형 코딩 에이전트는 당신의 가장 큰 제약(제어, 자율성, 또는 전체 앱 생성)에 맞는 것입니다. 더 넓은 선택지(Claude Code, Cursor, Codex, Aider, OpenClaw)를 원한다면, 전체 12개 에이전트 순위를 보세요. 이 글은 이 셋에만 집중합니다.
한눈에 보는 OpenHands vs Devin vs Manus (비교 테이블)
이 표는 세 가지를 나란히 빠르게 읽을 수 있는 가장 빠른 방법입니다. 표를 보기 전에 한 가지 주의할 점: Manus는 저장소 수정 도구가 아닌 앱 빌더이기 때문에 SWE-bench가 아닌 GAIA에서 벤치마크됩니다. Manus에 SWE-bench 점수를 강제로 적용하는 것은 부정직하므로 셀에 명시되어 있습니다. 아래의 모든 벤치마크 수치는 평가 방식(Verified)과 사용된 모델을 포함하고 있습니다.
숫자는 2026년 6월 6일 기준 swebench.com, devin.ai/pricing, openhands.dev에 대해 검증되었습니다.
OpenHands: 오픈소스, 자체 호스팅 선택지
OpenHands는 All Hands AI의 오픈소스 자율형 코딩 에이전트입니다. MIT 라이선스이며 자체 호스팅 무료(모델 API 추론 비용만 지불)이고, CodeAct 설정에서 Claude와 함께 약 72% SWE-bench Verified를 기록합니다. 이는 2026년 swebench.com 리더보드에 따른 오픈소스 에이전트 프레임워크 중 최고 점수입니다.
이름이 익숙하게 느껴진다면, 예전에는 OpenDevin이었기 때문입니다. All Hands AI는 2024년 말에 OpenHands로 브랜드명을 변경했습니다. 이 프로젝트는 GitHub 스타 70,000개 이상을 보유하고 있으며 실제 커뮤니티를 뒷받침하고 있습니다. 이는 생각보다 중요합니다: 오픈소스 에이전트의 경우 이슈 트래커가 지원 채널입니다.
핵심 기능은 BYOM(자신의 모델 가져오기)입니다. 한 제공자에 잠겨 있지 않습니다. OpenRouter를 통해 실행하거나 API에 직접 접속하거나, 완전 오프라인 운영을 위해 로컬 Ollama 모델을 가리킬 수 있습니다(자세한 내용은 자신의 모델에서 OpenHands를 실행하는 방법을 참조하세요). 터미널에서도 접근할 수 있습니다: openhands CLI를 사용하면 웹 UI를 건드리지 않고 작업을 시작할 수 있으며, 이는 CI에서 유용합니다. 더 넓은 에이전트 프레임워크 생태계와 깔끔하게 맞으며, 사용자 정의 도구를 위해 MCP와 연결할 수 있습니다.
호스팅하지 않으려면 무료 계층(MiniMax 모델)이 있는 OpenHands Cloud도 있습니다. Kubernetes와 RBAC를 갖춘 엔터프라이즈 자체 호스팅 경로는 상용 라이선스가 필요합니다.
솔직한 한계: 이것은 턴키형이 아닙니다. 설정 비용을 감수해야 합니다. Docker, 모델 구성, 감시할 샌드박스, 그리고 긴 Claude 실행이 잘못되면 스스로를 포함할 수 있는 추론 비용입니다. "인프라 작업 없음"이 절대 조건이라면 OpenHands는 당신의 선택지가 아닙니다.
제어, 자체 호스팅, 모델 선택이 편의성을 이기면 OpenHands를 선택하세요.
Devin: 턴키형 자율 엔지니어
Devin은 Cognition의 턴키형 자율 엔지니어입니다. 작업을 제공하면 최소한의 손을 쓰면서 계획, 코딩, 테스트, PR 개설을 합니다. 가격은 ACU(에이전트 컴퓨트 유닛) 기반이며, Core는 월 $20부터, Team은 월 $500부터 시작하며, Jira, Linear, Slack과 직접 연결됩니다. 세 개 중 가장 자동화된 것입니다.
ACU란 무엇입니까? 하나의 에이전트 컴퓨트 유닛은 대략 15분의 활성 자율 작업입니다. Core(월 $20)는 약 $2.25/ACU의 초과 요금과 10세션 한계와 함께 제공됩니다. Team(월 $500)은 약 $2.00/ACU의 250 ACUs를 번들로 제공하며 무제한 동시 세션을 제공합니다. 이것이 팀이 비용을 지불하는 실제 이유입니다: 동시에 다섯 개의 티켓에 Devin을 둘 수 있습니다. 엔터프라이즈는 맞춤형(VPC, SSO, 관리자 제어)입니다. 모두 devin.ai/pricing 기준입니다.
이제 벤치마크 질문입니다. 사람들이 혼동하기 때문입니다. 2024년 출시 당시 Devin은 SWE-bench에서 13.86%를 기록했습니다. 그 숫자는 여전히 마치 현재인 것처럼 블로그에서 떠다닙니다. 그것이 아닙니다. Devin 2.x는 오늘날 약 45~50% SWE-bench Verified입니다(이를 인용하기 전에 swebench.com에 대해 검증하세요). Cognition은 벤치마크 점수보다 실제 사용성에 최적화한다고 공개적으로 명시했으므로, Devin의 헤드라인 수치와 오픈소스 리더 간의 차이는 부분적으로 의도한 포지셔닝이지 순수 능력이 아닙니다. 비동기 작업만 실행한다면 배경 대 인라인 에이전트에 대한 우리의 생각도 읽어보세요.
솔직한 한계: ACU 모델은 사용량에 따라 비용이 증가하며 폭주하는 에이전트는 빠르게 예산을 소모합니다. 오픈소스 옵션보다 덜 투명하며 자체 호스팅할 수 없습니다. Cognition이 실행하는 것이 당신이 얻는 것입니다.
전체 엔지니어링 작업을 위임하고 개입을 줄이려면 Devin을 선택하세요.
Manus: 코딩도 하는 범용 에이전트 (그리고 Meta 질문)
Manus는 코딩도 하는 범용 자율 에이전트입니다. 다단계 작업을 계획하고, 라이브 웹을 탐색하고, 코드를 작성하고 실행하며, 전체 웹 앱(데이터베이스, Stripe, SEO)을 엔드투엔드로 빌드합니다. 가격은 크레딧 기반이며, SWE-bench가 아닌 GAIA에서 벤치마크됩니다. 2025년 12월 말 현재, Meta의 자산입니다. Meta 거래가 빌드 결정에 무엇을 의미하는지 아래에 설명합니다.
이 GAIA-vs-SWE-bench 세부사항이 Manus에 관한 전체 이야기입니다. SWE-bench는 저장소 수정을 측정합니다: 에이전트가 기존 코드베이스의 실제 버그를 수정하고 테스트를 통과할 수 있습니까? GAIA는 범용 작업 완료를 측정합니다: 에이전트가 다단계 작업을 계획, 탐색, 실행할 수 있습니까? Manus는 두 번째 것을 위해 만들어졌습니다. SWE-bench에서 어떻게 수행되는지 묻는 것은 일반 건설업자에게 치과 작업을 수행하도록 요청하는 것과 같습니다. 잘못된 도구, 잘못된 테스트입니다.
...