2026-05-21 AI 뉴스
20 May 2026Google Pics (AI 이미지 생성/편집 도구)
TechCrunch – 발행일: 2026-05-19
3min AI (일본어) – 발행일: 2026-05-21
요약
- Google I/O 2026에서 Google Workspace 내에 AI 기반 이미지 생성 및 편집 앱 ‘Pics’ 발표
- Nano Banana 2 모델 기반으로 텍스트 프롬프트로 이미지 생성 가능, 요소 단위 편집(이동·크기 조정·텍스트 번역) 지원
- Workspace Business Standard 이상 및 Google AI Pro/Ultra 구독자 대상으로 단계적 제공 예정
주요 내용 및 시사점
- 기술적 의미: Nano Banana 2의 정밀한 이미지 생성 및 요소 단위 편집 기술 도입
- 산업적 영향: Canva 등 디자인 툴 경쟁자와의 경쟁 본격화, 워크플로우 통합 강화
- 향후 전망: Workspace 전반으로 확산 예상, 구독 모델 전략의 성공 여부가 관건
Corti – Symphony for Speech‑to‑Text 출시
PR Newswire APAC – 발행일: 2026-05-20
요약
- Corti, 임상용 음성인식 모델 ‘Symphony for Speech‑to‑Text’ 출시
- 일반 API 대비 단어 오류율 최대 93% 감소 (영어 1.4% WER vs OpenAI 17.7%)
- Dragon Medical One 대비 성능 우수 (WER 4.6% vs 5.7%), 병용 정확도 및 형식화 Recall 크게 향상
주요 내용 및 시사점
- 기술적 의미: 의료용 전문화된 구조적 음성 인식, 다운스트림 AI 워크플로우와의 통합 용이
- 산업적 영향: 의료 문서화 자동화 가속, EHR 및 임상 AI 제품군에서 핵심 인프라 역할
- 향후 전망: 다양한 언어·국가 대상 확대 가능, 규제 민감 분야에서 신뢰 기반 확장 전망
NVIDIA – Nemotron‑Labs‑Diffusion 발표
NVIDIA Research – 발행일: 2026-05-19
TheRift.ai 요약 – 발행일: 2026-05-19
요약
- NVIDIA, AR(Autoregressive), Diffusion, Self‑Speculation 디코딩을 통합한 tri‑mode 언어 모델 ‘Nemotron‑Labs‑Diffusion’ 발표
- 병렬 토큰 생성 가능, AR 및 diffusion 상호 보완, 높은 처리량 및 효율성 달성 (8B 모델 기준 전진당 5.9× 토큰 처리)
주요 내용 및 시사점
- 기술적 의미: 텍스트 생성 방식에서 선형 접근 벗어나 병렬 처리 및 계획적 디코딩 구조 도입
- 산업적 영향: 추론 비용 절감 및 성능 향상, LLM 제공자들의 패러다임 전환 압력 증가
- 향후 전망: 에이전트 기반 AI와 실시간 응답 시스템에 적합, 오픈 소스 커뮤니티 확산 기대