News :
1 người rửa bát cả nhà mắc bệnh: 5 lỗi sai to đùng cần sửa ngay Cổ phiếu Vietjet bật tăng gần hết biên độ sau phiên giảm kỷ lục của thị trường chứng khoán, tỷ phú Nguyễn Thị Phương Thảo “đút túi” thêm hơn 2.000 tỷ Phòng khám cơ xương khớp Cầu Giấy được đánh giá cao Tải Mẫu phiếu đánh giá nhận xét thử việc song ngữ (Anh-Việt) chuẩn nhất hiện nay ở đâu? Chiên xúc xích bằng dầu là sai lầm – chuyên gia chỉ ra cách giúp món ăn ngon hơn, ít ai biết |#chillcover | Đêm Trắng Khắc Việt | quang hùng Cựu HLV Liverpool chia sẻ lý do từ chối ngồi ghế nóng tại MU Công trình hiểm trở bậc nhất Việt Nam và bí mật về kỹ thuật thi công không phải ai cũng có thể bắt chước Canva bất ngờ “bị sập” nguyên nhân từ đâu và khi nào sẽ phục hồi? Đặc sản miền Tây tên lạ, có miếng giống đuông dừa khiến khách tò mò HLV Liverpool cay cú chỉ trích lối chơi ‘xấu xí’ của MU Nhiều bệnh viện lớn bị tấn công mạng, dữ liệu bệnh nhân bị rao bán trên diễn đàn hacker BTV Minh Trang VTV đời thường gợi cảm, Doãn Quốc Đam bình thản giữa tranh cãi Phát động chiến dịch “Không một mình – Cùng nhau an toàn trực tuyến” tại TPHCM 65 tuổi, tôi nhất quyết muốn sống với con trai nhưng 3 năm sau, một cuộc điện thoại khiến tôi phải hối hận Status 20/10 hài hước, ý nghĩa giúp bạn ghi điểm với chị em ‘Du lịch Thụy Điển’ được đưa vào đơn thuốc Loại cây mọng nước trị tiểu đường, táo bón, viêm loét đến mụn nhọt Nhảy dây, chạy bộ hay bật nhảy tại chỗ “đốt mỡ” nhanh nhất? Câu trả lời khiến nhiều người bất ngờ! Sáng 21/10: Giá vàng trong nước cao kỷ lục, Bảo Tín Minh Châu nâng lên hơn 160 triệu đồng/lượng Lá é và lá giang có giống nhau không? Cách phân biệt đơn giản 4 loại hoa thắp hương Mùng 1 lộc hơn cúc vàng, vận hên cả tháng TPHCM tăng tốc cải cách hành chính, tỷ lệ hài lòng đạt gần 100% #topgamedoithuonguytin #haihuoc Leverkusen – PSG: Bất lực trước nhà vô địch iQOO 15 ra mắt cùng tai nghe iQOO TWS 5: Siêu phẩm pin 7.000mAh, Snapdragon 8 Elite Gen 5 và màn hình 2K siêu sáng Bé trai bị đánh giữa đường ở Hà Nội

Vì sao giọng nói được coi là ‘dấu vân tay âm thanh’?

Bộ Công an vừa hoàn thành dự thảo Quy chuẩn kỹ thuật quốc gia sinh trắc học giọng nói và dự thảo Quy chuẩn kỹ thuật quốc gia về sinh trắc học mống mắt. Đối với sinh trắc học giọng nói, dự thảo quy định độ tuổi lấy mẫu lần đầu từ đủ 6 tuổi; các lần lấy mẫu cập nhật dữ liệu vào độ tuổi từ 14 – 25, 25 – 40, 40 – 60.

Giọng Nói: Dấu Vân Tay Âm Thanh Độc Nhất Của Mỗi Người - Ảnh 1.

Sinh trắc học giọng nói (voice biometrics) là công nghệ nhận dạng và xác thực cá nhân dựa trên đặc điểm sinh học – âm học riêng của giọng nói

Ảnh: PHƯƠNG AN TẠO BỞI AI

PGS-TS Phạm Bích Đào (Bệnh viện Đại học Y Hà Nội) cho biết sinh trắc học giọng nói (voice biometrics) là công nghệ nhận dạng và xác thực cá nhân dựa trên đặc điểm sinh học – âm học riêng của giọng nói. Khác với nhận diện nội dung (voice recognition), sinh trắc học giọng nói tập trung vào cách phát âm, tần số rung, biên độ, độ vang, tốc độ nói, nhịp điệu và mẫu cộng hưởng, tức là “chữ ký sinh học” của giọng nói.

Khẳng định giọng nói là “đặc điểm sinh trắc học duy nhất” của mỗi cá nhân, bác sĩ Đào giải thích: Giọng nói là đặc điểm sinh học cá nhân, phản ánh cấu trúc giải phẫu riêng của thanh quản, xoang cộng hưởng, khoang miệng, cùng thói quen nói, ngữ điệu và cảm xúc. Vì vậy, không có hai người nào có giọng hoàn toàn giống nhau, kể cả sinh đôi cùng trứng. Do đó, giọng nói được coi là “dấu vân tay âm thanh” (audio fingerprint), tương tự vân tay hoặc mống mắt trong nhận dạng sinh trắc học.

Theo bác sĩ Đào, giọng nói là sản phẩm của sự phối hợp phức tạp giữa nhiều cơ quan trong cơ thể, gồm 3 hệ thống chính: hệ hô hấp (phổi, cơ hoành, khí quản – cung cấp luồng hơi); hệ thanh quản (dây thanh âm và sụn thanh quản – tạo dao động âm thanh gốc); hệ cộng hưởng và phát âm (họng, khoang miệng, khoang mũi, lưỡi, môi, răng, khẩu cái – khuếch đại và biến đổi âm sắc). Thực quản và dạ dày có thể tạo ra giọng bụng. Chính vì thế, trong trường hợp cắt thanh quản toàn phần, người ta có thể vận dụng tập nói giọng thực quản. Sự phối hợp tinh vi của các cơ quan này tạo nên đặc trưng âm học riêng biệt cho từng cá nhân.

CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN GIỌNG NÓI

Theo PGS-TS Phạm Bích Đào, một số bệnh lý và yếu tố có ảnh hưởng đến giọng nói. Trong đó, giọng nói có thể thay đổi tạm thời hoặc vĩnh viễn do bệnh lý tại thanh quản (viêm thanh quản, hạt – polyp dây thanh, liệt dây thanh, u thanh quản), bệnh hệ thống như: trào ngược họng – thanh quản, bệnh nội tiết (suy giáp, cường giáp), bệnh thần kinh.

Ngoài ra, một số yếu tố bên ngoài cũng ảnh hưởng đến thanh âm: hút thuốc, rượu, dị ứng, ô nhiễm, stress, lạm dụng giọng. Những thay đổi này làm biến đổi đặc trưng âm học của giọng nói (tần số cơ bản, cường độ…), từ đó ảnh hưởng đến khả năng nhận dạng sinh trắc học. Vì vậy, trong thực tế ứng dụng (như giám định tư pháp hay xác thực an ninh), cần có mẫu giọng tham chiếu ổn định và được cập nhật định kỳ.

Giọng nói nam và nữ có đặc điểm riêng. Trong đó, giọng nói của nam giới có âm trầm, vang do dây thanh dài hơn, dày hơn, tần số thấp (85 – 180 Hz). Với nữ giới, dây thanh ngắn, mảnh hơn, tần số cao (165 – 255 Hz), giọng nói có âm sáng, cao. Ngoài ra, cấu trúc cộng hưởng (xoang, hốc miệng, thể tích ngực) cũng góp phần tạo khác biệt rõ về âm sắc theo giới tính.

Giọng nói có thể thay đổi giới tính sinh học hoặc bị “lệch pha” trong các trường hợp: rối loạn nội tiết tố (dậy thì, mãn kinh, điều trị hormone, chuyển giới); do bệnh lý dây thanh hoặc phẫu thuật thanh quản; do huấn luyện giọng có chủ đích (đặc biệt trong nghề diễn viên, hát, chuyển giới). Khi đó, đặc điểm “giới” của giọng nói có thể biến đổi, gây nhầm lẫn trong nhận dạng sinh trắc học, đặc biệt nếu hệ thống trí tuệ nhân tạo chưa được huấn luyện đa dạng theo biến thể giới.

Các hệ thống sinh trắc học tiên tiến hiện nay có thể phân biệt “chất giọng gốc” nhờ phân tích đặc trưng phổ tần sâu (deep spectral features), ít chịu ảnh hưởng bởi thay đổi bề ngoài. Giọng nói được công nhận là một đặc trưng sinh trắc học hợp pháp, có thể được mã hóa, lưu trữ và so khớp để nhận dạng hoặc xác thực danh tính.

PGS-TS Phạm Bích Đào



Để lại một bình luận