본문 바로가기
리뷰/전자기기 사용기

Suno AI 페르소나, 보컬만 넣었을 때 달라진 결과와 듀엣 활용까지 정리

by 코스티COSTI 2026. 2. 10.

시작하며

Suno AI를 어느 정도 써본 사람이라면 한 번쯤은 이런 고민을 해봤을 것이다.

“분명 페르소나를 지정했는데, 곡마다 목소리가 조금씩 달라지는 느낌이 드는 이유는 뭘까?”

나 역시 같은 의문에서 출발했고, 결론은 의외로 단순했다. 페르소나에 무엇을 학습시키느냐였다.

특히 반주가 섞인 곡이 아니라, 보컬만 남긴 스템 소스를 썼을 때 차이가 분명하게 나타났다.

 

1. 스템 기능을 처음 만졌을 때 가장 먼저 막히는 지점

처음 스템 기능을 사용할 때, 분리한 파일이 워크스페이스에서 보이지 않는 경우가 있다.

이건 오류라기보다 설정 문제에 가깝다.

(1) 워크스페이스에서 파일이 안 보일 때 떠올린 장면

  • 필터 옵션이 활성화돼 있으면 스템 결과가 숨겨질 수 있다
  • Hide Stem 계열 옵션을 해제하면 분리된 파일들이 다시 나타난다
  • 필요 없는 경우에는 다시 끄는 방식으로 관리하면 된다

이 과정을 거쳐 보면, 반주가 빠진 보컬 단독 트랙이 따로 존재하는 걸 확인할 수 있다.

그리고 여기서부터 페르소나 활용의 방향이 완전히 달라진다.

 

2. 왜 페르소나는 ‘보컬만’ 넣어야 하는지

페르소나는 단순히 분위기를 참고하는 기능이 아니다.

이건 목소리의 결, 발음, 음정 처리 방식을 학습시키는 쪽에 가깝다.

(1) 인스포와 페르소나를 구분해서 써야 하는 이유

  • 인스포는 여러 곡의 스타일을 섞어 방향성을 잡는 용도다
  • 페르소나는 특정 목소리를 기준점으로 삼아 유지하는 기능이다
  • 반주가 섞이면 목소리보다 배경 정보가 더 많이 들어간다

그래서 같은 곡이라도, 보컬만 남긴 파일을 기반으로 페르소나를 만들면

AI가 참고해야 할 대상이 명확해진다.

이 차이는 결과물에서 생각보다 크게 드러난다.

 

3. 보컬 스템으로 페르소나를 만드는 실제 흐름

내가 사용한 방식은 꽤 단순하다. 대신 몇 가지 포인트를 놓치지 않았다.

(1) 페르소나 생성 단계에서 막히는 부분

① 검색이 안 될 때의 해결 방식

  • 워크스페이스에서 해당 보컬 파일의 점 세 개 메뉴를 연다
  • ‘Make Persona’ 항목을 직접 선택한다

② 이름과 스타일 설정에서의 선택

  • 이름은 목소리 성격만 드러나게 간단히 작성
  • 스타일 항목은 비워 두거나 최소화

③ 보컬 구간 선택 기준

  • 최대 30초까지 가능하므로 가장 안정적인 구간을 사용
  • 고음·저음이 극단적으로 튀지 않는 부분이 낫다

이렇게 저장하면, 페르소나는 목소리 중심 데이터만 가진 상태로 만들어진다.

 

4. 페르소나를 쓴 상태에서 전혀 다른 곡을 만들어 봤을 때

여기서 재미있는 실험을 하나 해봤다.

페르소나는 발라드 계열 남성 보컬인데, 곡은 밝은 팝 분위기로 설정한 것이다.

(1) 가사와 스타일을 일부러 어긋나게 둔 이유

  • 목소리가 스타일을 얼마나 견디는지 보고 싶었다
  • 장르 키워드는 가볍고 밝은 쪽으로 설정했다
  • 보컬 관련 직접 지시는 거의 넣지 않았다

결과를 들어보면, 곡 분위기는 바뀌었는데 목소리의 중심은 유지되고 있었다.

이 지점에서 페르소나의 역할이 확실해진다.

 

5. “다른 목소리를 추가해달라”는 지시가 먹히는 이유

페르소나를 지정한 상태에서, 프롬프트에 다른 목소리를 암시하는 키워드를 넣으면

AI는 기존 목소리를 버리지 않고 추가 레이어처럼 처리한다.

(1) 듀엣과 화음이 자연스럽게 나오는 조건

① 기존 페르소나의 비중 유지

  • 오디오 인플루언스 값을 너무 낮추지 않는다
  • 페르소나 우선순위를 흐리게 만드는 표현은 피한다

② 추가 목소리는 역할만 제시

  • 어린이 합창, 보조 코러스 같은 개념적 지시
  • 특정 인물이나 과도한 캐릭터 지시는 배제

③ 프롬프트는 간결하게

  • 설명이 길어질수록 페르소나가 흔들리는 경우가 있었다

이렇게 설정하면, 메인 보컬은 유지된 상태에서

뒤쪽이나 코러스에서 다른 목소리가 섞이는 구조가 만들어진다.

 

6. Sounds 프롬프트가 결과를 흔드는 지점

많이들 놓치는 부분이 바로 Sounds 관련 설정이다.

BPM, Key, Type은 단순한 정보가 아니라 목소리 표현 방식에도 영향을 준다.

 

🎯 분위기와 활용이 달라졌던 비교 포인트

  • 같은 BPM이라도 Type에 따라 보컬 리듬감이 달라진다
  • 루프 기반 사운드는 목소리를 타이트하게 만든다
  • 원샷 계열은 보컬 여백을 더 크게 남긴다

이 차이를 의식하고 프롬프트를 짜면,

같은 페르소나라도 곡의 인상이 완전히 달라진다.

 

7. 실패를 줄여준 프롬프트 정리

마지막으로, 여러 번의 시도 끝에 남긴 기준이다.

(1) 페르소나 중심 작업에서 지키게 된 원칙

① 보컬 지시는 최소화

  • 이미 페르소나가 역할을 한다

② 무드 키워드는 명확하게

  • 밝음, 차분함 같은 방향성만 제시

③ 장르 욕심은 한 번에 하나

  • 여러 장르를 섞으면 목소리도 흔들렸다

이 원칙을 지킨 이후로, 결과물의 편차가 눈에 띄게 줄었다.

 

마치며

Suno AI의 페르소나 기능은 단순한 옵션이 아니다.

특히 보컬만 남긴 스템 소스를 기반으로 만들었을 때,

목소리의 정체성과 일관성이 확실히 살아난다.

한 번 제대로 만든 페르소나는,

장르가 바뀌어도 중심을 잡아주고

듀엣이나 화음 요청에서도 기준점 역할을 해준다.

다음에 곡을 만들 때,

“이번에는 왜 목소리가 다르지?”라는 생각이 든다면

페르소나에 무엇을 넣었는지부터 다시 한 번 살펴보는 게 좋다.

그 차이가 생각보다 크다.

사업자 정보 표시
코스티(COSTI) | 김욱진 | 경기도 부천시 부흥로315번길 38, 루미아트 12층 1213호 (중동) | 사업자 등록번호 : 130-38-69303 | TEL : 010-4299-8999 | 통신판매신고번호 : 2018-경기부천-1290호 | 사이버몰의 이용약관 바로가기