Music & Voice
Suno/Udio แต่งเพลง, ElevenLabs สร้างเสียงพากย์, เทคนิค Speech-to-Speech ทำคนคุยกัน
Suno/Udio แต่งเพลง, ElevenLabs สร้างเสียงพากย์, เทคนิค Speech-to-Speech ทำคนคุยกัน
ออกแบบเพลงประกอบแบรนด์ และอัดเสียงพากย์บทสนทนาที่มีอารมณ์สมจริง
เป้าหมายการเรียนรู้
- เข้าใจเทคโนโลยี AI สำหรับการสร้างเพลงและเสียง
- สามารถใช้ Suno สร้างเพลงจาก Prompt ได้
- ใช้ ElevenLabs สร้างเสียงพูดคุณภาพสูงและ Clone เสียง
- เข้าใจเทคโนโลยี Speech-to-Speech และการประยุกต์ใช้
AI กับโลกของเสียงและดนตรี
AI ได้ก้าวเข้าสู่โลกของเสียงอย่างเต็มตัว ตั้งแต่การสร้างเพลงจากคำอธิบาย ไปจนถึงการClone เสียงมนุษย์ได้อย่างสมจริง เทคโนโลยีเหล่านี้เปิดโอกาสให้คนที่ไม่มีพื้นฐานด้านดนตรี สามารถสร้างสรรค์ผลงานเสียงระดับมืออาชีพได้
| ประเภท | เทคโนโลยี | เครื่องมือ | ตัวอย่างการใช้งาน |
|---|---|---|---|
| สร้างเพลง | Text-to-Music | Suno, Udio | เพลงประกอบวิดีโอ, Jingle โฆษณา |
| สร้างเสียงพูด | Text-to-Speech (TTS) | ElevenLabs, LOVO | Audiobook, Voice Over |
| Clone เสียง | Voice Cloning | ElevenLabs | พากย์เสียงตัวเอง, Podcast |
| แปลงเสียง | Speech-to-Speech | ElevenLabs | เปลี่ยนเสียงแบบ Real-time |
| แยกเสียง | Audio Separation | LALAL.AI | แยกร้องออกจากดนตรี |
Suno — สร้างเพลงจาก Prompt
Suno เป็น AI ที่สามารถสร้างเพลงพร้อมเนื้อร้องและดนตรีจาก Prompt ข้อความ เพียงบอกว่าอยากได้เพลงแบบไหน AI จะแต่งทั้งเนื้อเพลง ทำนอง และเรียบเรียงเสียงให้ครบ
สร้างภาพ A flat design infographic showing the AI music creation workflow with Suno. A horizontal pipeline: Step 1 'Text Prompt' (speech bubble with music description like genre, mood, instruments), Step 2 'AI Processing' (Suno logo with musical notes and gears), Step 3 'Generated Output' (showing both a music waveform and lyrics sheet). Below the pipeline, small icons show controllable elements: Genre, Mood, Instruments, Vocals, BPM, Language. Clean modern design with purple and orange gradient accents on white background. (ai_music_creation_workflow.jpg)
A flat design infographic showing the AI music creation workflow with Suno. A horizontal pipeline: Step 1 'Text Prompt' (speech bubble with music description like genre, mood, instruments), Step 2 'AI Processing' (Suno logo with musical notes and gears), Step 3 'Generated Output' (showing both a music waveform and lyrics sheet). Below the pipeline, small icons show controllable elements: Genre, Mood, Instruments, Vocals, BPM, Language. Clean modern design with purple and orange gradient accents on white background.
วิธีใช้ Suno
- 1เข้าเว็บไซต์ suno.com แล้วสมัครสมาชิก (ฟรี 50 เครดิต/วัน)
- 2เลือกโหมด: Custom (กำหนดเอง) หรือ Simple (ให้ AI ตัดสินใจ)
- 3พิมพ์ Prompt อธิบายเพลงที่ต้องการ
- 4รอ AI สร้างเพลง (ประมาณ 30 วินาที - 1 นาที)
- 5ฟังผลลัพธ์ เลือกเพลงที่ชอบ แล้วดาวน์โหลด
เทคนิคการเขียน Prompt สำหรับ Suno
# บอกแค่อารมณ์และแนวเพลง
"เพลงป๊อปสนุกๆ เกี่ยวกับวันหยุดพักผ่อนที่ทะเล ร้องเป็นภาษาไทย"
"Upbeat jazz about morning coffee in Bangkok"
"เพลงบัลลาดเศร้าๆ เกี่ยวกับความรักที่ต้องจากลา สไตล์ไทยสากล"# กำหนดเนื้อเพลงเอง
[Verse 1]
ตื่นเช้ามาดูฟ้า สดใสกว่าเมื่อวาน
ลมพัดเบาเข้ามา พาหัวใจไปไกล
[Chorus]
วันนี้เป็นวันดี วันที่ฉันมีเธอ
อยู่ตรงนี้ข้างกัน ไม่ต้องไปไหนไกล
# กำหนดแนวเพลง (Style of Music)
Thai Pop, Acoustic Guitar, Female Vocal, Happy, 120 BPM
# กำหนดชื่อเพลง
วันดีดี| Element | ตัวอย่าง | ผลลัพธ์ |
|---|---|---|
| แนวเพลง (Genre) | Pop, Rock, Jazz, R&B, Hip-hop, EDM | กำหนดสไตล์หลักของเพลง |
| อารมณ์ (Mood) | Happy, Sad, Energetic, Chill, Romantic | กำหนดอารมณ์โดยรวม |
| เครื่องดนตรี | Acoustic Guitar, Piano, Synth, Drums | กำหนดเสียงเครื่องดนตรี |
| เสียงร้อง | Male, Female, Duet, Choir | กำหนดลักษณะเสียงร้อง |
| BPM | 80 (ช้า), 120 (ปานกลาง), 150 (เร็ว) | กำหนดความเร็วของเพลง |
| ภาษา | Thai, English, Japanese | กำหนดภาษาเนื้อเพลง |
- [Intro] — ดนตรีเปิด
- [Verse] — ท่อนร้อง
- [Pre-Chorus] — ท่อนเชื่อมก่อนเข้า Hook
- [Chorus] — ท่อนฮุค ท่อนที่จำได้ง่าย
- [Bridge] — ท่อนเปลี่ยนอารมณ์
- [Outro] — ดนตรีปิด
- [Instrumental] — เฉพาะดนตรี ไม่มีร้อง
ElevenLabs — เสียงพูด AI ระดับโลก
ElevenLabs เป็นแพลตฟอร์ม AI ด้านเสียงที่ทรงพลังที่สุดในปัจจุบัน สามารถสร้างเสียงพูดที่ฟังดูเหมือนมนุษย์จริงรองรับกว่า 30 ภาษา รวมถึงภาษาไทย
ฟีเจอร์หลักของ ElevenLabs
| ฟีเจอร์ | คำอธิบาย | ใช้ทำอะไร |
|---|---|---|
| Text-to-Speech | แปลงข้อความเป็นเสียงพูด | Voice Over, Audiobook, Podcast |
| Voice Cloning | Clone เสียงจากตัวอย่างเสียง | พากย์ด้วยเสียงตัวเอง |
| Speech-to-Speech | เปลี่ยนเสียงแบบ Real-time | เปลี่ยนเสียงในการประชุม |
| Voice Library | เลือกเสียงจากคลัง | เลือกเสียงที่เหมาะกับงาน |
| Dubbing | พากย์เสียงข้ามภาษา | แปลวิดีโอเป็นภาษาอื่น |
| Sound Effects | สร้างเอฟเฟกต์เสียง | เสียงประกอบวิดีโอ |
การ Clone เสียง
Voice Cloning ช่วยให้คุณสามารถสร้างเสียงเลียนแบบตัวเองได้ โดยอัปโหลดตัวอย่างเสียงพูดเพียงไม่กี่นาที AI จะเรียนรู้ลักษณะเสียงและสามารถพูดข้อความใดก็ได้ด้วยเสียงนั้น
สร้างภาพ A flat design infographic showing the Voice Cloning pipeline with ElevenLabs. A horizontal flow diagram: Step 1 'Record' (microphone icon with audio waveform, labeled '1-5 minutes of clear speech'), Step 2 'Upload & Clone' (upload arrow into ElevenLabs AI brain icon, labeled 'AI learns voice characteristics'), Step 3 'Generate' (text document being converted to audio waveform with the cloned voice, labeled 'Type any text, get your voice'). Below shows quality tips: clear audio, no background noise, natural speaking pace. Modern clean design with teal and purple accents. (voice_cloning_pipeline.jpg)
A flat design infographic showing the Voice Cloning pipeline with ElevenLabs. A horizontal flow diagram: Step 1 'Record' (microphone icon with audio waveform, labeled '1-5 minutes of clear speech'), Step 2 'Upload & Clone' (upload arrow into ElevenLabs AI brain icon, labeled 'AI learns voice characteristics'), Step 3 'Generate' (text document being converted to audio waveform with the cloned voice, labeled 'Type any text, get your voice'). Below shows quality tips: clear audio, no background noise, natural speaking pace. Modern clean design with teal and purple accents.
- 1เข้า ElevenLabs > Voices > Add Voice > Instant Voice Cloning
- 2อัปโหลดไฟล์เสียงตัวอย่าง (แนะนำ 1-5 นาที เสียงชัด ไม่มี Background Noise)
- 3ตั้งชื่อเสียง แล้วกด Create
- 4เลือกเสียงที่ Clone มา แล้วพิมพ์ข้อความที่ต้องการให้พูด
- 5ปรับ Settings: Stability, Similarity, Style Exaggeration
- ห้าม Clone เสียงผู้อื่นโดยไม่ได้รับอนุญาต
- ระวังการใช้สร้าง Deepfake หรือ Scam
- ElevenLabs มีระบบตรวจสอบการใช้งานที่ผิดกฎหมาย
- ใช้เพื่อการศึกษาและสร้างสรรค์เท่านั้น
Speech-to-Speech — เปลี่ยนเสียงแบบ Real-time
Speech-to-Speech คือเทคโนโลยีที่สามารถเปลี่ยนเสียงพูดของเราเป็นเสียงอื่นได้แบบ Real-time โดยรักษาอารมณ์ น้ำเสียง และจังหวะการพูดเดิม
| การใช้งาน | คำอธิบาย | เหมาะกับ |
|---|---|---|
| Voice Acting | พากย์เสียงตัวละครหลายตัวด้วยเสียงเดียว | สร้าง Content, Podcast |
| Privacy | ปกปิดเสียงจริงในการสื่อสาร | การประชุมที่ต้องการ Anonymity |
| Accessibility | ช่วยผู้ที่มีปัญหาด้านเสียง | คนที่เสียงเปลี่ยนจากอาการป่วย |
| Entertainment | เปลี่ยนเสียงให้สนุก | Streaming, Gaming |
กิจกรรมปฏิบัติ
สร้าง Podcast สั้นๆ 2-3 นาที โดยใช้ Suno สร้างเพลง Intro/Outro และใช้ ElevenLabs สร้างเสียงพากย์ หรือ Clone เสียงตัวเอง
เครื่องมือที่ใช้ในบทเรียนนี้
| เครื่องมือ | ลิงก์ | ใช้ทำอะไร |
|---|---|---|
| Suno | suno.com | สร้างเพลงจาก Prompt |
| ElevenLabs | elevenlabs.io | Text-to-Speech, Voice Cloning |
| LALAL.AI | lalal.ai | แยกเสียงร้องออกจากดนตรี |
| CapCut | capcut.com | ตัดต่อเสียงและวิดีโอ |
Suno สร้างเพลงจากอะไร?
Voice Cloning ของ ElevenLabs ต้องใช้อะไรเป็นข้อมูลตั้งต้น?

