AI News Blog AI News Blog

2025-11-19 AI 뉴스

마이크로소프트·엔비디아·앤트로픽, ‘클로드(Claude) 모델을 애저에’…최대 1GW 컴퓨트·대형 투자 동시 발표

Microsoft Official Blog

마이크로소프트(이하 MS), 엔비디아, 앤트로픽이 11월 18일(현지) 전략적 제휴를 발표했습니다. 핵심은 앤트로픽의 최신 클로드(Claude) 계열 모델(클로드 소넷 4.5, 오푸스 4.1, 하이쿠 4.5 등)을 MS의 기업용 AI 개발·운영 환경 ‘Microsoft Foundry’와 애저(Azure) 생태계에서 공식 지원한다는 점입니다. 동시에 앤트로픽은 애저 컴퓨팅 자원을 300억 달러 규모로 구매하고, 최대 1기가와트(GW)에 달하는 추가 연산 용량을 계약할 수 있습니다. 엔비디아와는 차세대 아키텍처(그레이스 블랙웰·베라 루빈 등)에 맞춰 클로드 성능과 효율을 최적화하는 ‘공동 엔지니어링’ 파트너십을 맺었고, 투자도 병행됩니다(엔비디아 최대 100억 달러, MS 최대 50억 달러). 이로써 클로드는 AWS(베드록), 구글(버텍스 AI)에 이어 애저까지, ‘3대 클라우드’ 모두에서 공식 접근 가능한 유일한 ‘프론티어 모델’이 됩니다. 실무 관점에선 기업과 개발자가 특정 공급사에 묶이지 않고(락인 완화) “성능·비용·안전 기준에 맞는 모델을 상황별로 바꿔 쓰는” 멀티모델 전략이 쉬워집니다. 또한 MS–OpenAI 간 독점성이 완화된 최근 구조변경의 실효성이 드러난 셈입니다. 기업 IT 부서는 애저에서 클로드 기능(예: 코드·문서 요약, 다국어 고객응대, 규정 준수 답변 생성)을 곧바로 결합해 PoC→상용화를 빠르게 돌릴 수 있고, 대규모 연산(최대 1GW) 약정은 모델 추론/에이전트 운영 비용을 낮추는 데도 긍정적입니다. (blogs.microsoft.com)


구글, 차세대 ‘Gemini 3’ 공개…검색은 ‘생각(Thinking) 모드’로, 개발자는 ‘Antigravity’ IDE로 에이전트 코딩

AP News

구글이 차세대 모델 ‘Gemini 3’를 공개하고, 검색·앱 전반에 고도화된 추론·멀티모달 기능을 확장합니다. 일반 사용자에겐 ‘AI 모드’(검색 탭)에서 ‘생각(Thinking)’ 옵션을 제공해 복잡한 질문에 더 깊이 있는 답변을 주고, 지메일·여행 일정 등 작업을 모델이 대신 수행하는 실험적 에이전트 기능도 강화됩니다(프로/울트라 구독에서 우선 제공). 퍼블리셔 트래픽 감소 우려 속에서도 구글은 “요약+근거 링크” 중심의 결과를 확대하는 흐름을 이어갑니다. 개발자에겐 ‘Antigravity’라는 ‘에이전트-퍼스트’ IDE 프리뷰를 공개했습니다. 여러 AI 에이전트가 에디터·터미널·브라우저를 직접 제어하며 병렬로 과업을 수행하고, ‘아티팩트(Artifacts)’라는 작업 계획·증거물(스크린샷·녹화 등)을 남겨 투명성을 높입니다. 요지는 “단순 보조”를 넘어 “스스로 계획하고 실행하는 도우미(에이전트)”를 본격적으로 개발·검증·운영하자는 것. 산업적으로는 검색 UX가 ‘링크 목록’에서 ‘과정과 결과를 보여주는 대화 인터페이스’로 이행하고, 개발 워크플로도 ‘프롬프트-완성’에서 ‘다중 에이전트 오케스트레이션’으로 이동하는 신호입니다. 실무 적용 시에는 품질 보증(검증 가능한 산출물), 안전 가드레일, 비용(추론 시간·토큰)을 함께 설계해야 합니다. (apnews.com)


클라우드플레어 대규모 장애로 X·ChatGPT 등 다수 서비스 먹통…OpenAI “제3자 문제로 인한 장애, 복구 완료”

The Verge

11월 18일(미 동부 오전) 클라우드플레어의 구성 파일 오류로 대규모 장애가 발생해 X(트위터), ChatGPT, 심지어 장애 감시 사이트인 다운디텍터까지 접속에 문제가 생겼습니다. 클라우드플레어는 DDoS 방어·CDN 역할을 하는 핵심 인프라이므로, 단일 구성 실수도 대규모 연쇄 장애로 번질 수 있습니다. OpenAI는 상태 페이지에서 “외부(제3자) 서비스 이슈로 인한 접근 장애였으며 현재 복구됐다”고 공지했습니다. 교훈은 명확합니다. - 서비스 사업자: 멀티 CDN, 기능별 ‘우아한 강등(Degradation)’ 설계, 봇 차단 정책 변경에 따른 리스크 점검이 필요합니다. - 이용자·기업: 업무 연속성 관점에서 단일 AI 채널 의존을 줄이고 대체 경로(모델·플랫폼 이중화)를 갖추는 게 안전합니다. 생성형 AI가 ‘업무 필수’ 인프라가 되면서 네트워크·보안 계층의 안정성도 ‘AI 서비스 품질’ 그 자체가 되고 있습니다. (theverge.com)


마이크로소프트, 윈도우를 ‘에이전틱 OS’로 전환 선언…작업표시줄에서 에이전트 실행·파일 탐색기와 코파일럿 결합

The Verge

MS는 “윈도우를 AI가 일을 ‘대신 해주는’ 운영체제(Agentic OS)로 재설계”하겠다고 밝혔습니다. 작업표시줄에서 에이전트를 띄워 백그라운드로 문서 정리·데이터 조회·반복 업무 자동화를 시키고, ‘Ask Copilot’으로 로컬 검색과 대화형 코파일럿을 결합합니다. 모델 컨텍스트 프로토콜(MCP)을 통해 다양한 에이전트·툴을 안전하게 검색·호출하며, 에이전트는 샌드박스형 ‘에이전트 워크스페이스’에서 별도 계정으로 동작해 보안과 감사를 강화합니다. 사용자 입장에선 “한 번 시켜놓고 다른 일을 하는” PC 활용이 가능해지고, IT 부서는 정책·권한·로그 기반 통제 아래 여러 벤더의 에이전트를 조합할 수 있습니다. 다만 실제 업무 적용 시에는 ‘정확도·책임소재·기밀 데이터 접근’에 대한 가이드와 KPI(절감 시간·오류율·ROI) 정의가 필수입니다. (theverge.com)


마이크로소프트, 기업용 ‘Agent 365’ 공개…자율 AI 봇을 ‘격리·감사’하고 ROI까지 추적하는 관리 도구

Reuters

MS는 기업 환경에 확산될 ‘자율형 AI 에이전트’를 추적·통제하는 ‘Microsoft Agent 365’를 발표했습니다. 네트워크 접속자·권한을 관리하듯, 에이전트의 활동을 모니터링하고, 문제를 일으키는 봇은 ‘격리’하며, 각 에이전트가 실제로 업무를 얼마나 줄였는지(예: 재고·CS·공급망 자동화)의 효과를 수치화해 ROI를 평가합니다. 이는 에이전트가 OS·업무앱 전반으로 퍼질 것을 전제한 ‘거버넌스 레이어’입니다. 현업 부서엔 “마구 붙인 봇”이 오히려 혼선을 낳는 걸 막고, 보안팀은 권한 오남용·데이터 유출 리스크를 줄일 수 있습니다. 조직 적용 팁: (1) 파일·시스템 접근 범위를 최소 권한으로 설계, (2) 작업 기록·결정 근거(체인오브토트·툴 호출) 로깅, (3) 실패 시 사람 개입 핸드오버 정의가 필요합니다. (reuters.com)


백악관·공화당, ‘주(州)별 AI 규제 선제 차단’ 드라이브…NDAA(국방수권법)에 연방 단일 기준 ‘끼워넣기’ 추진

The Verge

11월 18일(현지) 하원 공화당이 ‘주(州) 차원의 AI 규제 모라토리엄(일시 금지)’을 연말 필수 통과법안인 국방수권법(NDAA)에 포함시키는 방안을 재추진하고, 트럼프 대통령도 “50개 주의 땜질 규제 대신 하나의 연방 기준이 필요하다”고 공개 지지했습니다. 이 이슈는 “혁신 저해 vs. 소비자 보호” 구도입니다. 연방 단일 기준은 기업 입장에서 규제 불확실성을 줄이고 전국 서비스 출시를 쉽게 하지만, 주(州)가 마련해 온 프라이버시·공정성·아동보호 장치를 약화시킬 수 있다는 반론도 큽니다. 향후 시나리오: (1) NDAA에 삽입돼 사실상 ‘연방법 우선’이 되거나, (2) 별도 법안으로 추진될 수 있습니다. 서비스 사업자는 ‘주별 준수’ 대신 ‘연방 표준 준수’ 중심으로 거버넌스를 재정렬해야 할 가능성에 대비할 필요가 있습니다. (theverge.com)


SC25(슈퍼컴퓨팅 2025) 현장: 엔비디아 ‘NVQLink’로 양자·GPU 결합 가속…파트너들, 블랙웰 기반 서버 줄발표

NVIDIA Press Release

미주·유럽 주요 슈퍼컴퓨팅 센터들이 엔비디아의 양자–GPU 연결 인터커넥트 ‘NVQLink’를 채택, ‘쿠다-Q(CUDA-Q)’로 양자/고전 하이브리드 워크플로를 가속한다는 소식입니다. 동시에 델, ASUS, 컴팔 등 파트너들은 블랙웰(B300/GB300) 기반의 대형 서버·랙스케일 솔루션을 일제히 공개했습니다. 의미는 두 가지입니다. (1) 단기: 기업도입형 ‘AI 팩토리’(대규모 추론/멀티모달/에이전트 운영) 인프라의 성숙. 더 빠른 네트워킹·스토리지 통합·액체냉각 등으로 TCO(총소유비용)를 낮추고, 서비스 응답지연을 줄입니다. (2) 중장기: 양자–GPU 융합은 약물·소재·최적화 같은 고난도 문제의 ‘AI+시뮬레이션’ 통합을 촉진해, 생성형 AI 서비스의 ‘사실성·물리 일관성’을 끌어올릴 기반이 됩니다. 인프라 공급 확대는 곧 “GPU 대기열” 완화로 이어져 모델 가격과 대기 시간(레이턴시) 절감에 긍정적입니다. (investor.nvidia.com)


순다르 피차이 “AI 버블 터지면 우리도 안전지대 아냐”…영국에 50억 파운드 투자·모델 현지 훈련 계획도 재확인

Reuters

알파벳 CEO 순다르 피차이는 BBC 인터뷰에서 “AI 거품이 꺼지면 어떤 회사도 예외가 아니다”라고 경고했습니다. 동시에 영국 내 데이터센터·딥마인드 투자 등 약 50억 파운드 규모의 AI 인프라 확충과 영국 내 모델 훈련 계획을 재확인했지만, 막대한 전력 수요 탓에 넷제로(탄소중립) 달성은 늦어질 수 있다고도 언급했습니다. 이는 지난 1년간의 ‘공급–수요’ 미스매치: 거대 투자·고평가 vs. 실제 수익화 속도의 간극을 반영합니다. 실무적으로는 (1) 전력·위치·냉각을 포함한 ‘탄소·에너지 예산’을 제품기획에 넣고, (2) 모델 경량화·추론 최적화(Flash/Thinking 등 계층형 모델)로 비용·환경 영향을 줄이며, (3) 지역 규제·전력망 여건에 맞춘 ‘리전별 아키텍처’를 설계하는 것이 관건입니다. (reuters.com)