Có lẽ bạn đã từng nghe nói đến việc người ta có thể phát hiện và đánh giá tương đối chính xác cảm xúc cũng như tâm trạng của một cá nhân nào đó thông qua ngữ điệu giọng nói hay bất kỳ âm thanh nào mà người đó phát ra. Trên thực tế, nhiều công ty khởi nghiệp đầy tham vọng như Beyond Verbal, Affectiva và MIT spinout Cogito hiện đang thúc đẩy các dự án xử lý ngôn ngữ tự nhiên để thực hiện điều này. Tuy nhiên, cũng đã có không ít ý kiến tỏ ra hoài nghi về những dự án đó và cho rằng chỉ dữ liệu về âm thanh là không đủ để đưa ra phân tích chính xác tâm trạng của một người, chứ chưa nói đến việc ứng dụng những kết quả phân tích này vào chẩn đoán tình trạng trầm cảm cũng như mức độ nghiêm trọng của nó.
- Mô hình AI của Disney tạo ra phân cảnh hoạt hình từ các kịch bản
Đây chính là lý do thôi thúc các nhà khoa học tại Viện Công nghệ Ấn Độ Patna và Đại học Caen Normandy bắt tay vào triển khai một dự án đầy tiềm năng, đó là sử dụng các tín hiệu bằng lời nói và cử chỉ (ngôn ngữ cơ thể), kết hợp với âm học, văn bản và hình ảnh để chẩn đoán và đánh giá mức độ trầm cảm hoặc căng thẳng mà một người đang gặp phải. Trong đó, tín hiệu bằng lời nói và cử chỉ sẽ vẫn đóng vai trò là yếu tố chính trong khâu chẩn đoán, trong khi các dấu hiệu và hình ảnh phi ngôn ngữ sẽ được sử dụng như những yếu tố giúp cải thiện đáng kể độ chính xác trong ước tính về mức độ trầm cảm.
"Gánh nặng trong công việc cũng như cuộc sống đang khiến ngày càng nhiều người phải sống chung với căn bệnh trầm cảm và thậm chí là những bệnh lý tâm thần mà đôi khi chính họ cũng không hề hay biết, dẫn đến tình trạng bệnh ngày càng trở nên trầm trọng hơn, đồng thời gây ra tác động xấu đến đời sống cũng như công việc. Đây cũng chính là lý do khiến chúng ta phải đẩy mạnh hơn nữa việc triển khai các công nghệ tiên tiến hơn, cá nhân hóa và tự động hơn trong khâu phát hiện, đánh giá, cũng như chữa trị các bệnh lý liên quan đến tâm thần nói chung và trầm cảm nói riêng. Tuy nhiên, việc phát hiện sớm các dấu hiệu của trầm cảm là một vấn đề đầy thách thức bởi nhiều triệu chứng của căn bệnh này hiện vẫn còn là bí mật và có thể gây nhầm nhẫn", các nhà nghiên cứu chia sẻ.
- EU: Các hệ thống AI nên được xây dựng và triển khai một cách minh bạch và có trách nhiệm
Để giải quyết vấn đề này, các nhà khoa học tại Viện Công nghệ Ấn Độ Patna và Đại học Caen Normandy đã tiến hành mã hóa một số yếu tố có thể ngầm ám chỉ cảm xúc, trạng thái của con người, bao gồm những tư thế như đầu gục xuống, ánh mắt, thời lượng và cường độ của nụ cười, cử chỉ chạm vào một vài khu vực nhất định trên cơ thể, cùng với văn bản và tín hiệu lời nói… Và sau đó đưa vào mô hình học máy rồi kết hợp chúng thành các vectơ (biểu diễn toán học). Các vectơ hợp nhất này sau đó đã được chuyển qua một hệ thống thứ hai nhằm dự đoán mức độ trầm cảm dựa trên thang đo suy giảm sức khỏe cá nhân (PHQ-8) - một xét nghiệm chẩn đoán thường được sử dụng trong các nghiên cứu tâm lý học lâm sàng quy mô lớn.
Để huấn luyện nhiều hệ thống AI khác nhau, các nhà nghiên cứu đã sử dụng dữ liệu trong AIC-WOZ - một bộ dữ liệu liên quan đến trầm cảm được tổng hợp từ Distress Analysis Interview Corpus. Bộ dữ liệu này bao gồm một lượng dữ liệu khổng lồ về cả cử chỉ, lời nói, ánh mắt cũng như hành động được trích xuất dựa trên các mẫu bản ghi âm thanh, đoạn video trả lời câu hỏi từ 189 cuộc phỏng vấn lâm sàng hỗ trợ chẩn đoán tâm lý đối với những biểu hiện như lo lắng, trầm cảm và rối loạn căng thẳng thần kinh sau chấn thương (những câu trả lời không đúng trọng tâm hoặc bỏ dở giữa chừng đã được bỏ).
- Mô hình AI của MIT có thể tự nắm bắt mối quan hệ giữa các đối tượng với lượng dữ liệu đào tạo tối thiểu
Sau một số bước tiền xử lý và đào tạo mô hình học máy, nhóm nghiên cứu đã so sánh kết quả của các hệ thống AI bằng 3 số liệu: Sai số toàn phương trung bình (RMSE), sai số tuyệt đối trung bình (MAE) và điểm số phương sai giải thích (EVS). Theo báo cáo của các nhà nghiên cứu thì sự hợp nhất của 3 yếu tố âm thanh, văn bản và hình ảnh đã giúp đưa ra ước tính có độ chính xác cao nhất về mức độ trầm cảm của một đối tượng cụ thể, vượt trội so với mức tối đa 7.17% trên RMSE và 8.08% trên MAE.
- Giải 'Nobel công nghệ' được trao cho phần mềm dạy AI học như người
Trong tương lai, nhóm nghiên cứu còn có kế hoạch thử nghiệm thêm các kiến trúc học tập đa nhiệm hiện đại (multitask learning architectures), đồng thời "đào" sâu hơn vào các vấn đề mới liên quan đến dữ liệu văn bản. Nếu mang lại kết quả tích cực, những dự án này sẽ thực sự là một bước tiến mạnh mẽ trong việc áp dụng trí tuệ nhân tạo vào y học nói chung và trong chữa trị các bệnh lý về thần kinh nói riêng, đồng thời đem lại triển vọng đầy hứa hẹn cho hơn 300 triệu người hiện đang mắc phải bệnh trầm cảm, và theo dự báo sẽ còn gia tăng nhanh hơn nữa trong vài năm tới, trên quy mô toàn thế giới.
Nhận xét
Đăng nhận xét