Có rất nhiều định dạng âm thanh và những định dạng mà chúng tôi nghe thấy nhiều nhất là WAV và MP3. Chúng là gì và khi nào cái này tốt hơn cái kia? Chúng tôi sẽ cung cấp mô tả ngắn gọn và so sánh chi tiết về các định dạng này từ góc độ người dùng cuối, chẳng hạn như người tạo podcast.
Có các loại định dạng âm thanh kỹ thuật số lossless và lossy. WAV không mất dữ liệu và đây là tiêu chuẩn CD âm thanh đã có từ khá lâu. Mặt khác, MP3 là định dạng mất dữ liệu áp dụng nén kỹ thuật số cho dạng sóng. Thuật toán nén giảm thiểu âm thanh ở các phạm vi mà tai người khó nghe và cảm nhận được, đồng thời cung cấp các tệp nhỏ hơn nhiều với sự đánh đổi các tạo tác âm thanh bằng khả năng nén khắc nghiệt.
Tóm tắt về WAV
Viết tắt của dạng sóng, định dạng tệp âm thanh này được tạo ra bởi sự hợp tác của Microsoft và IBM vào năm 1991. Đây thực sự là một định dạng âm thanh không mất dữ liệu. Nói cách khác, nó không đưa ra bất kỳ tính năng nén nào, thậm chí là mã hóa không phá hủy như FLAC. Tệp WAV là phiên bản kỹ thuật số gần nhất của tín hiệu analog. Ví dụ: khi bạn lưu âm thanh từ CD, nó sẽ được lưu ở định dạng WAV. Định dạng dạng sóng này sử dụng công nghệ gần đúng: điều chế mã xung tuyến tính (LPCM) chuyển tín hiệu tương tự mượt mà sang tín hiệu số để có thể ghi trên bộ lưu trữ dữ liệu kỹ thuật số (CD, HDD, Flash drive, v.v.).
Tệp WAV lưu trữ dữ liệu âm thanh và siêu dữ liệu, chẳng hạn như tên bản nhạc và nghệ sĩ, tốc độ mẫu và các thuộc tính khác.
Hầu hết các nhà sản xuất âm thanh chuyên nghiệp đều ghi âm ở định dạng WAV để tối đa hóa chất lượng âm thanh và giảm lỗi trong khi chỉnh sửa. Các tệp WAV được hầu hết mọi phần mềm chỉnh sửa âm thanh hỗ trợ, bao gồm các tùy chọn miễn phí như Audacity. Không cần codec hoặc plugin để đọc và lưu âm thanh ở định dạng này trên bất kỳ hệ điều hành nào. Chất lượng CD là WAV với âm thanh LPCM âm thanh nổi.
Giới thiệu về MP3
MP3 là một tiêu chuẩn mã hóa suy hao cho âm thanh kỹ thuật số. Ngoài ra, .mp3 là định dạng tệp và phần mở rộng cho các tệp âm thanh được nén bằng thuật toán MP3. Nén MP3 làm giảm độ chính xác của tín hiệu âm thanh và các thành phần của nó vượt quá khả năng nghe của hầu hết con người. Ví dụ: một người trưởng thành trung bình không thể nghe được tần số trên 18 000 Hz và dưới 40 Hz.
Ngoài ra, có các thông số tâm lý âm thanh được xem xét. Ví dụ: khi bản âm thanh đạt mức âm lượng cao nhất, chẳng hạn như tiếng trống, tai người không thể nhận ra chi tiết âm thanh tinh tế sau vài mili giây và nó cũng bị loại bỏ trong quá trình nén MP3.
Mã hóa âm thanh MP3 lossy giúp bạn cân bằng giữa kích thước tệp và chất lượng âm thanh. Cả băng thông mạng và thông số chất lượng MP3 đều là tốc độ bit. Trong MP3, tốc độ bit chỉ định số lượng bit dữ liệu âm thanh được tái tạo trong một khoảng thời gian nhất định.
Sự khác biệt giữa WAV và MP3 để ghi podcast
Nguyên tắc chung là bạn phải luôn làm việc với âm thanh lossless, như WAV. Bạn sẽ chỉ xuất phiên bản cuối cùng của podcast sang MP3 để tải lên dịch vụ lưu trữ.
Bởi vì bạn có thể chuyển đổi WAV sang MP3 chứ không phải ngược lại (có thể nhưng không hợp lý), hãy giữ tất cả các bản nhạc chính ở định dạng WAV và chỉ xuất bản sang MP3 khi bạn sắp giao sản phẩm hoặc gửi đi nghe trước.
Làm việc với WAV trong khi tạo Podcast
Theo mặc định, tất cả âm thanh được ghi trong phần mềm như Audacity hoặc Adobe Audition đều được ghi dưới dạng tệp WAV. Khi ghi xong, bạn có thể xuất nó sang WAV, MP3 hoặc định dạng âm thanh khác. Chúng tôi khuyên bạn nên xuất tất cả bản ghi âm giọng nói của mình sang WAV và chỉ cần thêm từ khóa, như RAW vào tên tệp. Ví dụ: “Lịch sử tóm tắt về Hy Lạp Podcast Phần 1 Lấy 1 RAW.wav”
Bằng cách này, bạn sẽ luôn có phiên bản chính của bản ghi âm mà bạn luôn có thể quay lại nếu một số chỉnh sửa âm thanh gặp trục trặc tại một thời điểm nào đó. Sau đó, bạn sẽ cần nỗ lực cải thiện giọng nói của mình, chẳng hạn như áp dụng khử tiếng ồn, khử nhấp chuột và các bộ lọc khác và kết quả này cũng có thể được xuất dưới dạng WAV.
Khi nào nên sử dụng MP3 trong quy trình tạo Podcast
Nếu bạn đang làm việc hoặc tạo podcast, việc lưu trữ tất cả phiên bản và các bước trong tất cả dự án ở định dạng WAV không mất dữ liệu có thể làm lộn xộn ổ đĩa và chiếm hết dung lượng trống của bạn. Trong trường hợp này, bạn có thể xuất tệp âm thanh sang MP3 để so sánh các phiên bản và chia sẻ nó với những đồng nghiệp có thể nghe trước tác phẩm của bạn. Đừng quên lưu trữ tất cả các bản nhạc chính của bạn ở dạng WAV trên ổ đĩa ngoài hoặc đám mây mạng nếu bạn có dung lượng hạn chế, chẳng hạn như 128 GB.
So sánh trực quan WAV và MP3
Để cung cấp sự so sánh trực quan giữa hai định dạng và thông số kỹ thuật của chúng, chúng tôi sẽ sử dụng công cụ miễn phí Audacity với thư viện xuất khẩu LAME MP3 codec được cài đặt (phiên bản 3.1). Chúng tôi sẽ ghi âm giọng nói và lưu tệp dưới dạng WAV trước rồi đến MP3.
Ảnh chụp nhanh đồ họa WAV
Đây là hình ảnh của tệp WAV ở hai chế độ xem, chế độ xem dạng sóng và chế độ xem phân tích quang phổ cung cấp thêm thông tin về lượng dữ liệu trên mỗi tần số. Như chúng ta có thể thấy, toàn bộ phổ từ 0 Hz đến 22 000 Hz chứa đầy dữ liệu.
Cách đọc phân tích quang phổ
Chế độ xem phân tích quang phổ có thể khó đọc nếu bạn nhìn thấy nó lần đầu tiên. Nó được sử dụng để tham khảo và chỉnh sửa bản ghi của bạn trong các ứng dụng chuyên nghiệp như iZotope RX, nhưng Audacity cũng có chế độ xem này.
Trên sơ đồ này, bạn có thể thấy tần số thấp cơ bản mạnh mẽ của giọng nam (80 đến 160 Hz) ở phần dưới cùng có màu trắng. Phần lớn đây là những nguyên âm. Gai màu đỏ là âm tiết (như S). Tiếng ồn tự nhiên có màu xanh lam ở tần số cao hơn và trông giống hệt tiếng ồn trắng trên TV.
Ảnh chụp nhanh đồ họa MP3
Như bạn có thể thấy, tất cả các tần số trên 20.000 Hz đều không tồn tại vì chúng đã bị cắt trong quá trình nén. Có nhiều hơn thế nữa trong hoạt động nén MP3, nhưng đây là thao tác rõ ràng nhất. Nếu phóng to, chúng ta sẽ thấy nhiều sự khác biệt hơn về chế độ xem quang phổ giữa WAV và MP3, tuy nhiên hầu hết những khác biệt này không ảnh hưởng đến chất lượng âm thanh.
So sánh bitrate và codec WAV và MP3
Thông tin tốc độ bit WAV
Chúng ta hãy xem lượng thông tin mà tín hiệu WAV mang theo mỗi giây. Hãy nhớ rằng chúng ta đang xem xét tín hiệu đơn âm của giọng thuyết minh. Ví dụ: một bản nhạc sẽ mang nhiều dữ liệu hơn. Chúng tôi sẽ sử dụng công cụ VLC miễn phí để kiểm tra lượng dữ liệu được truyền qua trung bình là 700 kbps.
Thông tin codec WAV
Chúng ta cũng có thể xem thông tin trên codec: PCM S16 LE (s16I). Tốc độ mẫu là 44.100 Hz ở 16 bit trên mỗi mẫu, đây là chất lượng CD tiêu chuẩn và bạn nên sử dụng các thông số này cho tất cả các bản ghi podcast.
Cài đặt lưu MP3
Chúng tôi khuyên bạn nên sử dụng Chế độ tốc độ bit không đổi để lưu tất cả các bản nhạc được nói. Thông số chất lượng nằm trong khoảng từ 128 đến 320 kbps. Tốc độ tốt nhất sẽ là 256 kbps.
Thông tin tốc độ bit MP3
Bây giờ, hãy kiểm tra lượng thông tin mà MP3 truyền đi mỗi giây. Tốc độ này là 256 kbps, thấp hơn gấp đôi so với WAV.
Thông tin codec MP3
Codec được sử dụng là MPEG Audio Layer 1/2 (mpga). Tốc độ mẫu là như nhau, là 44.100 Hz. Là tiêu chuẩn chất lượng CD và hoạt động với hầu hết các thiết bị, chương trình và dịch vụ trực tuyến. MP3 đã tăng Bit trên mỗi mẫu lên 32 nhưng nó được thực hiện tự động bằng thuật toán nén.
Tôi có bị giảm chất lượng âm thanh nếu chuyển đổi định dạng WAV sang MP3 không?
Chắc chắn rằng kích thước tệp sẽ bị giảm rõ rệt khi bạn chuyển đổi WAV sang MP3. Nếu bạn chọn đúng tốc độ nén MP3 thì chất lượng âm thanh sẽ không bị giảm đáng kể. Ví dụ: hầu hết người nghe trên thiết bị tiêu dùng sẽ không phân biệt được sự khác biệt giữa MP3 ở tốc độ 320 kbps và WAV trong khi kích thước tệp sẽ nhỏ hơn đáng kể. Do đó, nó sẽ tải và truyền phát nhanh hơn.
Tuy nhiên, khi bạn đặt chất lượng MP3 ở tốc độ bit thấp hơn (áp dụng tính năng nén dữ liệu nặng hơn), chẳng hạn như 128 kbps trở xuống, các thành phần giả kỹ thuật số có thể trở nên đáng chú ý và thậm chí gây mất tập trung. Lời khuyên hữu ích là bạn nên nghe trước âm thanh MP3 của mình bằng tai nghe tham chiếu hoặc màn hình phòng thu. Nếu bạn không thể nhận ra sự khác biệt, điều đó có nghĩa là không ai trong số khán giả cũng nhận ra điều đó.
Có nhiều thuật toán mã hóa và định dạng tệp nâng cao hơn, ví dụ như M4A hoặc AAC, tuy nhiên MP3 vẫn là định dạng tệp âm thanh dễ nhận biết nhất. Nhân tiện, bạn cũng có thể chuyển đổi WAV sang các định dạng này bằng dịch vụ của chúng tôi.
Kích thước và hạn chế giữa các định dạng
Các tệp WAV chiếm khoảng 5 MB trong một phút cho một bản nhạc đơn âm. Ví dụ: giọng nói dài 2 phút 10 giây của chúng tôi chiếm 11,5 MB trên đĩa.
MP3 nhỏ hơn gần 3 lần và chiếm 4,2 MB. Tỷ lệ kích thước tệp WAV so với MP3 (2,74) nhỏ hơn tỷ lệ bitrate (2,75) vì MP3 nén dữ liệu giống như ZIP. Kiểm tra xem nó trông như thế nào khi đặt cạnh nhau trong một hệ điều hành:
Điều gì tốt hơn cho YouTube MP3 hoặc WAV?
YouTube là dịch vụ video nên bạn không thể tải lên các tệp chỉ có âm thanh, chúng phải được chuyển đổi trước thành tệp video. Bạn có thể đặt hình ảnh tĩnh, thêm nhạc nền cho podcast của mình và chuyển đổi bằng dịch vụ của chúng tôi.
Ngoài ra còn có dịch vụ YouTube Music, nơi bạn thực sự có thể tải lên các tệp âm thanh. Như đã đề cập trên các trang trợ giúp của YouTube , bạn có thể tải lên FLAC, MP3, M4A và một số định dạng khác, nhưng không thể tải lên WAV.
Chúng tôi khuyên bạn nên giữ âm thanh đã ghi của mình dưới dạng WAV để xử lý và chuyển đổi sang định dạng đích. Nó sẽ bảo quản chất lượng tốt nhất cho mỗi điểm đến. Sử dụng trình chuyển đổi của chúng tôi bất cứ khi nào bạn cần để điều chỉnh nó cho phù hợp với YouTube hoặc bất kỳ nền tảng nào khác.
Bản tóm tắt
Mặc dù WAV là định dạng không mất dữ liệu và không nén, chiếm quá nhiều dung lượng nhưng đây là định dạng tốt nhất để lưu trữ bản ghi thô của bạn với chất lượng tối đa có thể. MP3 linh hoạt hơn nhiều trong việc chia sẻ trên Internet, tải lên các dịch vụ, v.v. Hãy nhớ chọn cài đặt nén MP3 phù hợp và sử dụng một công cụ chuyển đổi đáng tin cậy để sản xuất âm thanh của bạn.