Chúng ta không chỉ nghe thấy nhạc. Trải nghiệm âm nhạc của chúng ta bão hòa trong các kỳ vọng văn hóa, ký ức cá nhân và nhu cầu được di chuyển.
Ngày nay, dễ nghĩ về âm nhạc chỉ đơn giản là một chuỗi âm thanh - được ghi âm và mã hóa vào một stream trên Spotify, nhưng không, thực ra (âm nhạc vẫn) là một hiện tượng âm thanh mà chúng ta đáp lại vì cách nó xảy ra. Nguồn gốc sức mạnh của âm nhạc, theo cách diễn đạt này, nằm ở chính các nốt nhạc. Muốn phân tích cách âm nhạc ảnh hưởng chúng ta cũng là phân tích các nốt nhạc và phản ứng của chúng ta: nốt nhạc bước vào, cảm nhận của ta về nó chộn rộn bước ra. Phép màu của bản Hallelujah mà Leonard Cohen sáng tác hoạt động thế nào? Đơn giản thôi, quãng 4, quãng 5, điệu thứ trầm, điệu trưởng cao… (ND: lời bài hát)
Nguồn: Calico Jo
Tuy nhiên nghĩ về âm nhạc theo cách này - là theo âm thanh, nốt nhạc và cách ta ứng đáp với các nốt nhạc, tách biệt khỏi phần còn lại của trải nghiệm sống - đã đem âm nhạc vào một bầu không khí cầu kỳ, khó hiểu mà chỉ những kẻ nhập môn mới tiếp xúc như vậy. Suy cho cùng, các nốt nhạc là những âm thanh mà hầu hết con người cảm thấy bất an mỗi khi phải xướng lên hoặc mỗi khi đọc từ nhạc phổ. Cảnh tượng một máy đọc nốt trơ trọi trong não, ghi nhận âm thanh vào và sản xuất ra các cảm nhận về âm nhạc, ký thác âm nhạc thành một thứ lò chứa trong đầu không hơn.
Nhưng làm thế nào khả năng nhận thức vốn xa rời khỏi phần trải nghiệm còn lại của con người lại có thể tiến hóa một cách độc lập như vậy? Và làm thế nào một thứ hiếm hoi bằng ấy lại tạo ra những cảm xúc và ký ức mãnh liệt với nhiều người trong chúng ta? 
Thực tế, công trình tiến hành nhiều thập kỷ qua trong ngành khoa học nhận thức về âm nhạc đã cho thấy, ngày một thuyết phục hơn, rằng khả năng về âm nhạc của con người không cô lập khỏi phần còn lại của tâm trí. Trái lại, cảm thụ âm nhạc bện chặt với các hệ thống tri giác khác, khiến cho âm nhạc không hẳn chỉ là một chuỗi các nốt nhạc đơn thuần, là địa hạt của các nhà lý thuyết và nhạc công chuyên nghiệp, mà gần hơn với một trải nghiệm thiết yếu của con người.
Việc chụp não cho ta một bức tranh đặc biệt rõ nét về sự tương kết này. Khi con người nghe nhạc, không chỉ một trung khu âm nhạc đơn nhất lóe sáng. Trái lại, cả một hệ thống được phân bổ rộng đều được kích hoạt, bao gồm những khu vực gắn với thị giác, khu vực kiểm soát cử động tay chân, cảm giác, lời nói, ký ức và cả khu vực đưa ra các hoạch định. Không chỉ đơn thuần vén bức màn về một lĩnh vực cô biệt, chỉ liên quan đến âm nhạc mà thôi, công nghệ tinh kỳ nhất mà chúng ta có trong tay có thể chui sâu vào bộ não, cho thấy rằng quá trình nghe nhạc kích ứng một loạt các khả năng đa dạng, minh chứng rõ nét sự cảm nhận âm nhạc luôn gắn quyện với các khía cạnh khác trong trải nghiệm của con người. Không chỉ là những gì ta nghe thấy, nhìn thấy, hay kỳ vọng, cách ta đi đứng, và toàn thể những trải nghiệm của chúng ta, tất cả đều góp vào cách chúng ta cảm nhận về âm nhạc.
Khi nhắm mắt lại, ta có thể hình dung ra một buổi trình diễn âm nhạc hết sức sống động: ta có thể nhìn thấy, chẳng hạn, một cái miệng mở rộng, một tấm thân lắc lư, những cánh tay hẩy cây guitar vào không trung. Một khi đã bắt đầu hình dung ra hình ảnh sống động này, rất dễ bắt đầu nghe thấy các âm thanh mà nó tạo ra. Thực tế là khó có thể hình dung các cử động kia mà lại bỏ qua không tưởng tượng nốt phần âm thanh của nó. 
Hoặc ta có thể quan sát - tắt đi âm lượng - hai tiết mục biểu diễn của cùng một bản sonata cho dương cầm trên Youtube, một do một nghệ sĩ thể hiện bằng các cử chỉ khoa trương và biểu đạt bằng nét mặt, và một do một nghệ sĩ miệng khép, ngồi cứng nhắc và bất động cạnh phím. Dù thứ thông tin duy nhất mà chúng ta nhận được chỉ là hình ảnh, ta sẽ hình dung hai âm thanh rất khác nhau: từ nghệ sĩ thứ nhất, những dòng uyển chuyển giữa các cao độ và nhịp tấu, còn ở nghệ sĩ thứ hai, các hòa âm trực diện và không có biến tấu xảy ra. 
Có thể nào dữ kiện hình ảnh thật sự ảnh hưởng đến cảm nhận nhạc thanh, và góp đáng kể vào trải nghiệm thưởng thức chung của một tiết mục biểu diễn hay không? Nhiều nghiên cứu đã cố gắng giải đáp câu hỏi này. Trong một hướng tiếp cận, nhà tâm lý học Bradley Vines ở ĐH McGill, Canada, cùng cộng sự đã ghi hình lại các tiết mục biểu diễn chủ đích sẽ giàu diễn cảm cũng như các tiết mục “khô như ngói”, khi các nghệ sĩ được thông báo sẽ biểu diễn với càng ít biểu cảm càng tốt. Sau đó các nhà nghiên cứu đem các bản thu này đến các chủ thể tham gia thí nghiệm, hoặc cho họ xem hình không có tiếng, hoặc chỉ mở phần tiếng không kèm hình, hoặc mở trọn toàn bộ phần ghi hình - hoặc, theo một cách lén lút, tráo phần âm thanh và hình ảnh với nhau.
Kết quả là những người tham gia thí nghiệm có khuynh hướng mô tả rằng phần trình diễn có hình ảnh biểu cảm là biểu cảm và gợi cảm hơn - hơn là từ bản thu của tiết mục được tấu. Trong một thí nghiệm khác không liên quan, nhà tâm lý học Chia-Jung Tsay của University College London cho thấy rằng người ta dự đoán chính xác hơn những ứng viên sẽ chiến thắng trong các cuộc tranh tài âm nhạc khi xem video ghi âm tiết mục biểu diễn không có tiếng, hơn là khi thưởng thức tiết mục diễn sống, hoặc khi xem video có mở tiếng.
Dường như âm nhạc là một hiện tượng đa phương thức tiếp nhận. Những chuyển động của nghệ sĩ tạo ra âm thanh đóng góp một cách trọng tâm, không phải ngoại vi, vào trải nghiệm nghe - và phần thông tin hình ảnh đôi khi còn ảnh hưởng mạnh mẽ hơn chính phần âm thanh.
Dữ liệu hình ảnh có thể chuyển tải không chỉ âm thanh trong nội dung cảm xúc, mà còn cả đặc tính về cấu trúc cơ bản của tiết mục. Công trình của hai nhà tâm lý Bill Thompson ở ĐH Macquarie, Sydney và Frank Russo ở ĐH Ryerson, Toronto, cho thấy con người có thể định được thời lượng của quãng ngân cả khi họ không nghe được nó - chỉ bằng cách quan sát biểu hiện trên khuôn mặt và chuyển động của đầu. Khi video quay hình một ai đó đang ngân quãng dài hơn đặt với phần tiếng của một giọng ngân ngắn hơn, người ta có thể thật sự nghe thấy quãng dài hơn. Tương tự, khi Michael Schutz và Scott Lipscomb, đều ở ĐH Northwestern, Illinois, tráo video một nghệ sĩ chơi bộ gõ diễn một nốt dài với phần tiếng của một nốt ngắn hơn, người tham gia thí nghiệm thật sự nghe thấy quãng ngân của nốt nhạc trở nên dài ra.
Sự tích hợp đa giác quan ở tầm cơ bản thế này củng cố thành các ảnh hưởng cấp độ cao hơn của thị giác đối với cảm giác tri nhận được. Chẳng hạn, ghép phần tiếng của một quãng ngân điệu thứ, thường cho là buồn, với video ghi hình một ca sĩ nào đó hát ở điệu trưởng, thường cho là vui, dẫn tới việc quãng điệu thứ được đánh giá là vui hơn.
Một trải nghiệm âm nhạc không chỉ giản dị là một báo hiệu âm-thị giác. Có thể chúng ta tìm nghe một ban nhạc mới vì bạn thân giới thiệu, hay vì muốn làm đẹp lòng cha hoặc mẹ. Có thể chúng ta thưởng thức một buổi hòa nhạc trong một khán phòng lộng lẫy cùng khán giả bóng bẩy, hoặc có thể ta bén chân vào một địa điểm lẻ quạnh với một nhúm những chàng và nàng nom chán bỏ đi được, tất cả đều tránh càng xa sân khấu càng tốt. Các tình huống này gợi ra những bộ kỳ vọng khác biệt rất rõ ràng. Thông tin và những giả định mang theo đến buổi hòa nhạc có thể hoặc quyết định đó là một trải nghiệm đáng nhớ hay thảm bại, trước khi nốt nhạc ngân lên.
Joshua Bell là một nghệ sĩ vĩ cầm ngôi sao trình diễn tại các khán phòng hòa nhạc lớn nhất thế giới. Người ta dốc ra hơn 100 USD để mua vé xem ông biểu diễn. Mọi thứ về bối cảnh của một buổi hòa nhạc điển hình hàm ngụ rằng âm nhạc của ông xứng đáng thế nào với sự quan tâm của khán giả: các không gian rộng lớn với trần cao vút, sự yên ắng của đến hàng ngàn khán thính giả, tầm cao của sân khấu. Năm 2007, một phóng viên tờ Washington Post nảy ra ý về một thí nghiệm xã hội: chuyện gì sẽ xảy ra nếu nghệ sĩ tầm cỡ quốc tế này trình diễn một cách vô danh ở ga tàu điện ngầm thành phố? Chắc chắn sự tinh kỳ của âm thanh tạo ra sẽ bức người dân thành phố ra khỏi thói quen buổi sáng để hòa vào một trải nghiệm thưởng thức khoa trương.
Trái lại, suốt 35 phút biểu diễn tác phẩm của Bach, chỉ có vỏn vẹn bảy người dừng lại ở những quãng thời gian khác nhau (ND: có một người duy nhất nhận ra đó là Joshua Bell). Người qua đường để lại tổng cộng 32 USD, và sau khi nốt nhạc cuối cùng vang lên, không hề có lấy một tiếng vỗ tay - chỉ có tiếng hối hả liên miên của những con người đang tranh thủ đến toa xe. Các bình luận đã diễn giải giai thoại này biểu đạt nhiều điều khác nhau: sức ép thời gian của cư dân thành thị, sức mạnh của sinh nhai làm lu mờ những khoảnh khắc có thể mang lại nhiều ý nghĩa, hay sự quý báu của tuổi thơ (nhiều trẻ em dừng lại để nghe, để rồi bị cha mẹ hối rời đi). Nhưng quan trọng không kém là, nó cho thấy sức mạnh vô song của tiếng đàn vĩ cầm Bell tấu chẳng nằm độc nhất ở các âm thanh mà ông tạo ra. Không có dấu chỉ, dù cụ thể hay khơi gợi chuẩn bị để người nghe có trải nghiệm thẩm mỹ cho là có tính chất quan trọng, họ không kích hoạt những bộ lọc cần thiết để hấp thu những nét âm thanh mà khi trong các tình huống khác có thể đã dẫn đến các trải nghiệm thưởng thức tuyệt vời. Kể cả trình độ diễn tấu ở mức thượng thừa cũng nằm dưới và phụ thuộc những ảnh hưởng định hình này. Âm thanh không thôi vẫn chưa đủ.
Joshua Bell nơi ga tàu điện ngầm và giữa khán phòng
Các nghiên cứu khác cũng chỉ ra rằng một vai trò quan trọng của ngữ cảnh đối với thưởng thức âm nhạc. Vào năm 2016, với đồng nghiệp Carolyn Kroger tại ĐH Arkansas, tôi đã mời người tham gia đến nhiều cặp tiết mục biểu diễn thuộc cùng một trích đoạn, nhưng mách trước với họ một tiết mục do một nghệ sĩ dương cầm lừng danh thế giới biểu diễn, còn tiết mục còn lại do một sinh viên nhạc viện: họ nhất nhất chuộng tiết mục biểu diễn chuyên nghiệp hơn - dù họ đang nghe tiết mục đó, hay nghe tiết mục do người sinh viên, hoặc thực tế vẫn nghe cùng một đoạn ghi âm lặp lại lần thứ hai, người nghe có khuynh hướng chuộng trích đoạn thứ hai trong cặp thưởng thức. Khi hai yếu tố này trùng khớp - khi tiết mục thứ hai cũng là tiết mục của nghệ sĩ chuyên nghiệp - khuynh hướng ưa thích dành cho nó vẫn đặc biệt rõ nét. Công tác chụp ảnh não sử dụng cùng cách thức của cá nhân tôi cho thấy mạch ban thưởng đã được kích hoạt để phản ứng với mục tiêu là người biểu diễn chuyên nghiệp, và tồn tại xuyên suốt thời lượng của trích đoạn; kết quả tìm kiếm này thuận với các nghiên cứu chụp ảnh não trước đó đã cho thấy sự nhạy cảm của mạng thần kinh tưởng thưởng với thông tin ngữ cảnh, ảnh hưởng hoặc có khi còn tăng sự sung sướng trong một trải nghiệm gợi dục.
Không chỉ cảm giác của chúng ta về chất lượng tiết mục biểu diễn có thể bị thông tin ngoại tác thao túng; cảm giác của chúng ta về nội dung biểu đạt cũng có thể thay đổi. Trong một nghiên cứu gần đây, chúng tôi nói với mọi người mình có một thông tin đặc biệt về các trích đoạn âm nhạc mà họ sẽ thưởng thức: cụ thể, chúng tôi biết đôi điều về ý định của nhà soạn nhạc khi sáng tác. Không hề được báo trước cho các đối tượng tham gia, chúng tôi tạo ra các mô tả ý định sao cho một số trong đó hết sức tiêu cực, và một số trung hòa. Chẳng hạn, chúng tôi có thể nói rằng một nhà soạn nhạc sáng tác tác phẩm để mừng dịp người bạn thân kết hôn, hay để thương tiếc một người bạn đã mất, hay để hoàn thành một đơn đặt hàng sáng tác. Chúng tôi xáo các cặp mô tả sao cho cùng các trích đoạn ghép với các mô tả với mỗi người khác nhau. Ở từng phiên thử, người tham gia đọc mô tả ý định, rồi lắng nghe trích đoạn, rồi trả lời câu hỏi liên quan tới nó.
Khi biết rằng đoạn trích được viết vì một lý do tích cực, người ta nghe thấy âm nhạc vui tươi hơn, còn khi biết đoạn trích viết ra trong một tình huống tiêu cực, họ thấy tác phẩm buồn hơn. Khi phân lại giọng điệu trữ tình của trích đoạn đã tạo ra các ảnh hưởng quan trọng đối với trải nghiệm thưởng thức. Khi cho rằng tác phẩm được viết ra vì một nguyên nhân vui tươi nào đó (ngạc nhiên thay, một phần khác của cùng nghiên cứu chỉ ra rằng người ta thích và xúc động trước thi ca khi họ cho rằng bài thơ viết ra vì một nguyên nhân buồn bã), người ta thích các đoạn trích hơn và dễ xúc động hơn. Ngữ cảnh giao tiếp và xã hội mà tiết mục biểu diễn diễn ra bên trong - các mô tả ý định mô phỏng sơ sài trong nghiên cứu - có thể nhuốm những sắc nghĩa rất khác cho cùng những âm thanh đó.
Nhạc đúng có thể khiến cả một căn phòng nhảy nhót. Thậm chí những người ở các buổi hòa nhạc cổ điển, dẫu phản đối các cử động thái quá khi thưởng thức, cũng đôi khi khó cưỡng cảm giác phải nhịp chân hay gõ ngón tay theo nhạc. Quá trình chụp não đã chỉ ra trải nghiệm nghe nhạc thụ động có thể kích hoạt hệ thống điều khiển tay chân. Sự quấn bện giữa âm nhạc và chuyển động là một hiện tượng phổ biến và sâu sắc, phổ biến ở khắp các nền văn trên khắp thế giới. Sự liên kết tương hỗ này đồng nghĩa với việc không chỉ những gì ta nghe thấy ảnh hưởng cách ta chuyển động, mà còn cho thấy cách chúng ta di chuyển có thể ảnh hưởng đến cách ta nghe nhạc.
Để kiểm chứng ảnh hưởng này, các nhà tâm lý Jessica Phillips-Silver và Laurel Trainor ở ĐH McMaster, Ontario thử lay lắc các em bé mỗi hai hoặc ba nhịp trong lúc chúng nghe một trích đoạn âm nhạc mơ hồ nào đó có đặc trưng là có tiết tấu hai hoặc ba nhịp. Trong quá trình tiếp xúc này, các bé vẫn nghe cùng một loại nhạc, nhưng một số lay theo nhịp hai (sau hai nhịp gõ, hoặc một đoạn nhạc hành khúc), và một số lay theo nhịp ba (sau ba nhịp gõ, tức đoạn nhạc waltz). Trong quá trình thí nghiệm kế tiếp, bọn trẻ được nghe những phiên khác nhau của trích đoạn có đoạn bổ sung tiếng sau mỗi hai hoặc ba nhịp gõ, chuyển trọng tâm chú ý từ vận động sang thính giác. Trẻ nghe lâu hơn phiên bản khớp với kiểu rung mà chúng trải qua trước đó – các em đã được lay theo nhịp ba thích phiên có nhịp ba. Nói cách khác, các bé này đã chuyển các mẫu chuyển động chúng đã nghe bằng cách thức vận động, thông qua chuyển động, sang các mẫu chúng nghe bằng thính giác, thông qua âm thanh. Thứ mà các bé cảm nhận ở âm thanh bị bó khung trong cách chúng chuyển động.
Kết quả nghiên cứu này vẽ ra một bức tranh về trải nghiệm nghe nhạc: cách chúng ta tương tác bằng vận động với âm nhạc rất quan trọng.
Kiểm chứng liệu sự chuyển hóa này từ vận động sang âm thanh có xảy ra ở người lớn hay không đòi hỏi có thêm một số chỉnh sửa vào cách thức tiến hành nghiên cứu – không dễ dàng bế người lớn rồi lay họ như trẻ con. Trái lại, người trưởng thành được dạy làm thế nào để co gối sau mỗi hai hoặc ba nhịp của trích đoạn nhạc được mở. Và không cần phải tạo ra một cách nghe để từ đó suy ra được các khía cạnh trong cảm nhận âm thanh của trẻ chưa biết nói, các nhà nghiên cứu đơn giản chỉ cần hỏi các đối tượng tham gia đoạn trích nào trong hai đoạn trích nghe giống với đoạn trong giai đoạn tiếp xúc hơn. Họ chọn ra từ những phiên bản khác nhau của trích đoạn đã được thêm vào các chỗ nhấn cách cứ hai hoặc ba nhịp. Tương tự với những đứa trẻ, những người trưởng thành cho rằng phiên bản họ nghe giống nhất khi phiên bản đó có nhịp khớp với cách họ đã chuyển động. Tác động này vẫn hiện diện kể cả khi các chủ thể thí nghiệm bị bịt mắt lại, cho thấy cảm nhận có thể chuyển hóa từ vận động sang âm thanh kể cả trong sự khiếm khuyết của ảnh hưởng thị giác. Các chuyển động khẽ hơn sự rung lắc toàn thân cũng có thể ảnh hưởng đến cảm nhận về âm thanh. Các chủ thể được yêu cầu xác định những tông nhạc cụ thể xuất hiện trên nền nhạc thuộc chuỗi các tông gây nhiễu thực hiện tốt được khi họ nhịp ngón tay vào một tấm hút âm hơn là khi họ không nhịp theo.
Cùng với nhau, các kết quả thử nghiệm này vẽ ra một bức tranh về trải nghiệm thưởng thức âm nhạc, ở đó không chỉ là cái mà ta nhìn thấy, nghe thấy và biết về âm nhạc định hình nên trải nghiệm, mà cách ta vận động tiếp xúc với nó cũng quan trọng không kém. Điều này đúng trong các văn hóa âm nhạc tham dự phổ biến trên thế giới, ở đó mọi người dường như góp vào quá trình sáng tác âm nhạc, nhưng còn ở các nền văn hóa đại diện kém phổ biến hơn, ở đó các tình huống dường như yêu cầu phải nghe thụ động, không di chuyển. Kể cả trong ngữ cảnh ấy, thời điểm và cách một người chuyển động có thể hình thành nên cái mà họ nghe.
Ngữ vựng âm nhạc và phong cách âm nhạc mà người ta nghe trong quá trình trưởng thành có thể hình thành nên các cấu trúc và thành phần biểu đạt mà họ có thể nghe thấy mỗi khi thưởng thức một tác phẩm mới. Chẳng hạn, người ta thể hiện ký ức nhận dạng tốt hơn và phản ứng cảm xúc tốt hơn với âm nhạc sáng tác theo một phong cách văn hóa quen thuộc, so với âm nhạc sáng tác đến từ một nền văn hóa ngoại lai. Nhưng sự tiếp xúc với âm nhạc trước đó không chỉ hình thành nên hệ thống cảm nhận âm nhạc: trường âm thanh ngôn ngữ mà cá nhân lớn lên cũng có thể tái định dạng định hướng âm nhạc của họ.
Ở các ngôn ngữ như tiếng Anh, cao độ mỗi từ được phát âm không làm ảnh hưởng đến ý nghĩa trong từ điển của nó. Motorcycle nghĩa là một phương tiện hai bánh gắn động cơ dù cho tôi có lên giọng hay xuống giọng. Nhưng các ngôn ngữ khác, như tiếng Quan thoại hay tiếng Thái, là ngôn ngữ hữu thanh: khi người Hoa nói cao bằng giọng cao, đều mawith có nghĩa là mẹ, nhưng nếu họ nói từ đó bắt đầu cao, rồi thấp rồi lại cao, nó có nghĩa là ngựa. Sự quan trọng trung tâm của cao độ trong nội dung khái niệm ở các ngôn ngữ này đồng nghĩa rằng người nói các ngôn ngữ hữu thanh sẽ tạo ra và nghe thấy cao độ khác hẳn với những người dùng ngôn ngữ phi thanh. Người nói ngôn ngữ hữu thanh, chẳng hạn, phát hiện và lặp lại giai điệu âm nhạc cũng như vai trò của cao độ chính xác hơn người nói ngôn ngữ phi thanh.
Văn hóa và kinh nghiệm có thể thay đổi cách nghe nhạc, không chỉ cách người ta hiểu nó.
Nhà tâm lý Diana Deutsch ở ĐH California, San Diego tạo ra quãng tam cung (hai nhịp cách nhau ½ quãng tám) từ các thanh âm có cao độ khác thường được xử lý kỹ thuật số. Người ta nghe các quãng tam cung này như lên hoặc xuống (nốt thứ nhất thấp hơn hoặc cao hơn nốt thứ hai) tùy vào ngữ cảnh văn hóa mà họ trưởng thành cùng. Người dùng tiếng Anh lớn lên ở California có khuynh hướng nghe quãng tam cung này hạ dần. Người nghe tiếng Trung lớn lên ở các ngôi làng có thổ ngữ khác nhau cũng cho thấy những khác biệt tương tự. Một đặc tính đặc biệt của nghịch lý quãng tam cung này nằm ở chỗ người nghe nào nghe thấy quãng nghỉ giữa hai cao độ cao hơn thường trải qua chuyển động nhích lên như một phần của cảm nhận họ có được, và ngược lại với những người nghe nào nghe thấy quãng nghỉ thấp hơn cảm thấy chuyển động hạ xuống. Tác động này ảnh hưởng đến cảm giác thô về âm thanh, chứ chẳng phải diễn giải nào diễn ra sau đó. Văn hóa và kinh nghiệm có thể thay đổi cách nghe nhạc, chứ không chỉ cách ta hiểu nó.
Sự đồng lệ thuộc của nhiều khả năng khác nhau dễ dàng tạo nền tảng cho một số các ứng dụng trị liệu và tiện ích mà âm nhạc có được. Như nhà nghiên cứu thần kinh Oliver Sacks quá cố đã viết trong Musicophilia (2007), khi một bệnh nhân bị mất trí nghe nhạc họ từng nghe khi chưa trưởng thành, bà ta trở nên gắn bó và sinh ra phản ứng, cho thấy chừng mực mà các giai điệu này có thể mang theo cùng những ký ức tự sự.
Âm nhạc không thể được hình dung thẳng thừng là một hiện tượng âm thanh. Mà nó là một trải nghiệm đa thức, được mã hóa văn hóa. Ở một thời điểm nào đó trong lịch sử khi khoa học thần kinh có thể có quyền năng gần như huyền nhiệm, ta cần ghi nhớ rằng chặng đường từ âm thanh đến trải nghiệm dệt xuyên hình ảnh, ký ức, chuyện kể, vận động và từ ngữ. Bỏ qua phần ca từ, sức hút của bản Hallelujah của Leonard Cohen chẳng đến trực tiếp từ quãng 4, quãng 5, điệu thứ trầm, điệu trưởng cao… Các trải nghiệm về bài hát hiện tại dường như tô vẽ bằng sự tiếp xúc với hằng hà các bản cover, và việc nó xuất hiện dày đặc trong các bộ phim như Shrek. Âm thanh ấy có thể mang theo hình ảnh một con chằn tinh xanh lá cây hay một ông cụ nhăn nheo đến từ Montreal (ND: tức Leonard Cohen), hay các cảm giác đã trải qua từ một buổi hòa nhạc hàng nhiều thập kỷ trước.
Dù đôi khi được cho là một loại hình nghệ thuật trừu tượng, tương tự với thế giới số học và toán học, âm nhạc mang theo nó và được hình thành nên từ gần như mọi khía cạnh khác nhau của trải nghiệm con người: cách chúng ta nói và đi đứng, cái chúng ta thấy và biết. Quyền năng mãnh liệt của âm nhạc cuốn con người vào trong âm thanh của nó phụ thuộc rất lớn vào những gắn kết chặt chẽ giữa sự nghe với vô vàn cách thức cảm nhận và tìm hiểu.
Nguồn: aeon