본문 바로가기
리뷰/전자기기 사용기

무료로 AI 음성까지 완성, 구글 AI 스튜디오 실사용 후기

by 코스티COSTI 2025. 12. 22.

요즘은 목소리부터 영상까지 AI로 만드는 시대다.
특히 구글 AI 스튜디오는 그중에서도 무료로 시작하기에 가장 손쉬운 도구였다.
처음 접했을 때만 해도 개발자용 사이트라는 느낌이 강했지만, 막상 써보면 구조가 단순하다.
무겁지 않게 음성을 실험해 볼 수 있어서 개인 크리에이터에게도 꽤 유용했다.

 

처음 접속하면 낯설지만 금방 익숙해진다

‘구글 AI 스튜디오’를 검색하면 공식 페이지로 바로 들어갈 수 있다.
로그인을 하면 중앙에 ‘Playground’라는 메뉴가 보인다. 이곳이 핵심이다.
왼쪽 메뉴에서 ‘오디오’를 선택하면 AI가 직접 말하는 목소리를 생성할 수 있는 기능이 등장한다.
겉보기엔 단순한 입력창이지만, 세부 조절을 하면 생각보다 정교한 결과가 나온다.

 

Temperature 조절이 핵심이다

가장 흥미로웠던 건 ‘Temperature’ 설정이다.
이 수치가 낮을수록 AI는 대본 그대로 또박또박 읽는다.
반대로 높일수록 감정이 섞인 말투, 즉흥적인 표현이 늘어난다.
예를 들어 0.2는 뉴스 앵커처럼 차분하게, 0.8은 마치 성우처럼 자연스럽게 읽어 준다.
나는 0.5 근처에서 가장 균형 잡힌 결과를 얻었다.

 

멀티스피커 기능으로 대화 장면을 구현할 수 있다

AI 스튜디오의 강점은 ‘멀티스피커’ 기능이다.
한 화면 안에 여러 인물이 대화하는 장면을 손쉽게 만들 수 있다.
각 인물의 이름을 입력하고 대본에 맞게 배정하면, AI가 자동으로 역할을 구분해 읽어 준다.
실제 애니메이션처럼 빠른 캐릭터와 느긋한 캐릭터를 동시에 연출할 수 있다는 점이 인상적이었다.

 

대본의 구조도 생각보다 단순하다.
‘이름: 대사’ 형식만 지키면 AI가 알아서 누가 말하는지를 인식한다.
형식이 틀리면 경고 표시가 나오지만, 이름만 정확히 맞추면 문제없이 진행된다.
색깔 표시로 캐릭터별 대사가 구분되어 보기에도 편했다.

 

감정 표현을 섬세하게 조정할 수 있다

오른쪽 설정 창에는 ‘스타일 인스트럭션’이 있다.
여기에 “따뜻하고 차분하게”, “흥분한 캐스터처럼” 같은 문장을 입력하면 말투가 바뀐다.
단순한 TTS(문자 음성 변환)를 넘어 감정의 결을 조정할 수 있다는 게 인상적이었다.
나는 ‘친근한 설명조로 말해줘’라고 입력했더니, 의외로 부드럽고 자연스러운 결과가 나왔다.

 

무료로 쓸 수 있는 범위도 넉넉하다

다른 AI 음성 도구들은 무료 버전이 1~2분 수준인 경우가 많지만,
구글 AI 스튜디오는 한글 기준 약 5~10분 분량까지 문제없이 생성됐다.
짧은 콘텐츠를 만들거나, 애니메이션 더빙을 테스트하기엔 충분한 시간이다.
특히 출력 속도가 빠르고, 웹브라우저만 있으면 바로 실행할 수 있다는 게 큰 장점이었다.

 

편집 단계에서 주의할 점도 있다

생성된 음성 파일은 mp3나 wav 형식으로 저장된다.
이걸 영상 편집 프로그램에 불러올 때 타이밍이 약간 밀릴 수 있다.
캡컷이나 프리미어프로에서 ‘컨트롤+B’로 세밀하게 잘라 맞추면 해결된다.
다만 AI 스튜디오에서 긴 대사를 한 번에 만들면 간혹 음성이 끊기거나 에러가 발생할 수 있다.
그래서 나는 2~3분 단위로 나누어 생성하는 방식을 썼다.

 

타입캐스트와 비교했을 때의 인상

  • 타입캐스트는 감정 조절과 캐릭터 폭이 넓다. 다만 무료 사용 시간이 짧고, 출처 표기가 필수다.
  • 구글 AI 스튜디오는 무료 범위가 넓고 처리 속도가 빠르다. 다만 일부 목소리는 다소 기계적이고, 편집 시 타이밍 조정이 필요하다.

 

결국 목적이 다르다.
광고용이나 감정이 강조된 콘텐츠에는 타입캐스트가, 실험용·내레이션용 작업에는 구글 AI 스튜디오가 더 효율적이다.
특히 구글 쪽은 개발자 환경에 익숙하지 않아도 금세 다룰 수 있어서, 처음 AI 목소리를 다뤄보는 사람에게는 좋은 출발점이었다.

 

직접 써보며 느낀 현실적인 장점

가장 인상 깊었던 건 진입장벽이 거의 없다는 점이었다.
설치도 필요 없고, 로그인 후 바로 대사를 입력하면 즉시 결과를 들을 수 있다.
게다가 음성 생성 속도가 빠르다 보니, 대본을 수정하면서 여러 버전을 바로 테스트할 수 있었다.
AI가 말투를 바꿔 읽는 걸 들을 때마다, 마치 실제 성우와 작업하는 느낌이 들 정도였다.

 

AI로 음성을 만드는 게 낯설게 느껴지더라도, 구글 AI 스튜디오는 생각보다 쉽게 접근할 수 있다.
몇 번만 반복해 보면 자연스럽게 리듬과 감정 조절의 포인트가 보인다.
이 도구 하나만으로도 짧은 콘텐츠나 더빙 영상을 완성할 수 있었다.
결국 중요한 건 도구의 복잡함이 아니라, 얼마나 구체적으로 표현을 시도하느냐였다.

사업자 정보 표시
코스티(COSTI) | 김욱진 | 경기도 부천시 부흥로315번길 38, 루미아트 12층 1213호 (중동) | 사업자 등록번호 : 130-38-69303 | TEL : 010-4299-8999 | 통신판매신고번호 : 2018-경기부천-1290호 | 사이버몰의 이용약관 바로가기