2024. 2. 21
レビュー論文への付言 (1)
AMSSの元代表2人が執筆した,音刺激による神経可塑性についての論文が出版された(オンラインアクセスはこちら)。
この論文を書きながら疑問に思ったことや苦労したことを ―― 本文中のなかでは文字にしなかった部分も含め―― ここに付言し,今後の音楽神経学の課題を明確にできればと思う。
今回の論文を書いたモチベーションとして,まず,神経内科医として未だ解明されていない神経疾患の謎について少しでも手がかりを得たいという思いはある。大学を卒業して臨床医学にどっぷり浸かりながらも,なお神経科学に固執する理由がここにある。特に神経疾患が脳の高次機能に及ぼす影響については未開拓の領域が非常に多く,この領域に強い関心がある自分は,音楽神経学で頻繁に議論されるcognitionやemotionに関する話題が臨床医学にいつか応用できるのではないかと考えているのだ。
言語学への思いが強いがゆえ,いまの失語症の臨床についてはモヤモヤすることが多い。失語症の多彩な臨床像を説明するために30ほどの失語図式がこれまで考案されてきたが,そのなかで残ったのは結局,Wernicke-Lichtheimの図式のみである。この図式のもとになった症例はほとんど脳梗塞であり,Wernicke-Lichtheimの図式は脳血管障害の失語症の分類と言った方がよい。自分が医師になってから経験した脳梗塞患者の症候学をある程度この図式で説明できている印象はあるが,ADやPD,PSPなどの疾患の言語障害にどれくらい当てはまるかと言われると自信がない。もっというと,脳血管障害以外の機序の神経疾患が呈する言語障害をはたして失語症と呼んでよいかについても議論がある。失語症の定義に揺らぎがある理由として時に「脳の個体差」が引き合いに出されるが,ここ20年神経科学が脳の後天的な変化について数々のエビデンスを蓄積してきたことを考えると,定義を再考する土壌はかなり形成されつつあるのではないか。むしろ言語の後天性がもたらす言語能力の多様さは,失語症の病態を柔軟に考え直すうえで有利になるとすら思う。
音楽神経学が臨床言語学に寄与する展望を大きく切り開いたのはKrausとChandrasekaranの論文 (1) であった。「脳の個体差」を相手にする場合には,それが先天的なものか後天的なものかの峻別(いわゆるnature vs nurtureの議論)がしばしば問題になるが,この問題を彼らは明確に突いた。1990〜2000年代前半の音楽神経科学の研究を見渡してみると,音楽家と非音楽家の脳構造や機能を比較した横断研究が大部分を占めることが分かる。横断研究の問題は,それが明らかにした音楽家の脳の特徴がnature的要因とnurture的要因のどちらで説明できるかを区別できない点だ。実際,nurture的要因で説明されてきたものが後になって実はnature的要素が大きいのではないかと異議が唱えられることもしばしばであった。これを解決すべく音楽トレーニングの効果を縦断的に検証した研究が2000年代後半からちらほら現れるようになり,その流れに沿って Kraus & Chandrasekaran (2010) も音楽トレーニングに伴う脳の縦断的な変化について論じた。まずもって,今回のレビュー論文も縦断研究のみを扱っていることが重要だ。
そのうえで,Kraus & Chandrasekaran (2010) の功績は,音楽トレーニングが音楽スキルの発達のみならず発話言語処理を含む聴覚スキル全般の発達にも転移効果(これをtransfer effectと呼ぶ)を示す機序を神経学的に明らかにしたことだ。Morenoらが2009年の時点で,子供の音楽トレーニングが絵画トレーニングに比べて「音」のピッチ判別だけでなく「言語」の課題の成績をも向上させることを示し(これも縦断研究だった),大きな話題を呼んでいた (2)。そのメカニズムとして,Kraus & Chandrasekaran (2010) は音楽と発話言語の神経処理の共通性を指摘した。 これは,言語だけでなく音楽の神経処理にcognitiveな要素があることを指摘したという点で意義深い。具体的には,音楽トレーニングとは音からピッチや音色といった情報を抽出し,記憶や情動などと照合しつつその構造や規則を理解するプロセス,すなわち「音」を「意味」へと結びつけるプロセス(彼らの言葉を借りれば‘Sound’ to ‘Meaning’)であると述べたのだ。このプロセスが発話言語処理の聴覚スキルに必要なのは言うまでもない。
この時点ではまだ,音と言語の神経処理の共通性は「エビデンス」というより「仮説」といった方がいい段階であったが,その後Kraus & Chandrasekaran (2010) の主張を裏付けるエビデンスが蓄積されてきて,こうした研究が我々のレビュー論文の発想のヒントになっている。どのような音刺激をレビューに含めるかは慎重に考えたポイントである。音楽でない純粋な「音」を音刺激として用いた膨大な研究を分析しないわけにはいかないだろうということで,音楽を含めた幅広い「音」を許容したいというのは早い段階で決めていたが,そうは言っても「音」がもつ多様な要素をどこまで絞るかが悩ましかった。カバー範囲を絞りすぎると論文としての外的妥当性を損なうことになるが,かといって広げすぎると内容が散逸した長大な論文になる。結果としては,「音」の要素を幅広く許容して扱う形となったが,これはKraus & Chandrasekaran (2010) あたりからの研究の流れを追っていけばそうせざるをえなくなるという感覚が強かった。というのも,たとえばKraus & Chandrasekaran (2010) を支持する聴性脳幹反応(ABR)の研究を俯瞰してみると,もともとsine波音やclick音など単純なものしか扱っていなかったところ,後になって音楽や言葉といった複雑な音刺激をも扱うようになってもなおABRが音と言語の神経基盤の共通性を示唆する結果を量産し続けたからだ。それこそKrausらの研究グループの有名な研究を一つ紹介すると,ノイズのある騒然な環境での音刺激(ここでは発話)に対するABRについて「音楽家は非音楽家よりノイズ環境で発話音の聴覚スキルが高い」という結果が示された (3)。
この研究は別に2つの点で意義深いと思う。一つに,音楽家の方が言語発話処理に優れる理由として音楽家は脳幹で発話情報のencodingが精度良く行われているという研究者らの主張が,皮質下レベルでの神経基盤にまで踏み込んでいた点が重要だ。空間分解能が低いという脳波の最大の弱みを抱えながらもKrausらは皮質→脳幹のトップダウンの入力についての考察を深めていった (4) わけだが,聴覚情報処理のneural oscillationにひそむ神秘的な同期活動を次々と暴いていく脳波研究の先駆けになったのは間違いない。このような脳内ネットワークの階層に基づいたlower-orderからhigher-orderに至るまでの神経処理のメカニズムは今回のレビュー論文でしつこく記述している。もっとも,脳幹レベルの研究は空間分解能の問題もあってか道半ばだ。レビューの検索条件に引っ掛かった論文数の少なさがそれを物語っている。音楽や言語のhigher-orderな神経処理を解明するうえではABRのなかでも周波数追従反応(FFR)が重要とされ,その起源について2016年にZatorreらの研究グループが大きな業績を挙げた (5) のはEEGより空間分解能が優れたMEGの恩恵でもあった。こうした技術の進歩を考慮して,今回はEEGだけでなくMEGを用いた論文もレビューしている。が,少なくともFFRについては,管見の限りGorina-Caretaらの優れた研究 (6) を最後に目立った研究の進展はない。Zattoreらが言う “the strong bidirectional anatomical connections between higher and lower nuclei in the auditory system” について脳幹レベルまで含めた深い洞察ができるほどエビデンスが蓄積されているとは言い難い印象を受けた。そもそも皮質レベルで神経の階層的処理についての研究が発展途上であることがその原因になっていることは否めない。たとえばZatorreらの研究結果と反する意見として「FFRはrepetition suppressionが見られないから皮質は関与していないはずだ」という主張がある(7) が,それを確立するにはまずは皮質レベルのrepetition suppressionとは何たるかが十分に解明されなければならない。そのため,皮質レベルのbidirectional connectionsをめぐる議論を今回は重点的に扱うことにした。
話を戻そう。もう一つの意義深い点は,一般人にも「カクテルパーティー効果」の名で比較的よく知られた現象について神経基盤を探究したことである。この多くの音の中から自分が必要としている情報や重要な情報を無意識に選択することができる脳の働き(神経科学界隈ではselective attentionと呼ぶ)はどのようなメカニズムで成り立っているのだろうか。figure-ground segregationをキーワードとして諸文献をレビューしていった。その過程で,selective attentionが一筋縄ではいかないややこしい概念であることが分かってきた。その詳細は次稿に譲る。
文責:司馬 康
参考文献
1. Kraus, N. & Chandrasekaran, B. (2010) Music training for the development of auditory skills. Nature Reviews. Neuroscience, 11(8), 599–605.
2. Moreno, S., Marques, C., Santos, A., Santos, M., Castro, S. L., & Besson, M. (2009) Musical training influences linguistic abilities in 8-year-old children: more evidence for brain plasticity. Cerebral Cortex, 19(3), 712–723.
3. Parbery-Clark, A., Skoe, E., & Kraus, N. (2009) Musical experience limits the degradative effects of background noise on the neural processing of sound. The Journal of Neuroscience, 29(45), 14100–14107.
4. Tzounopoulos, T. & Kraus, N. (2009) Learning to encode timing: mechanisms of plasticity in the auditory brainstem. Neuron, 62(4), 463–469.
5. Coffey, E.B.; Herholz, S.C.; Chepesiuk, A.M.; Baillet, S.; Zatorre, R.J. (2016) Cortical contributions to the auditory frequency-following response revealed by MEG. Nature Communications. 7, 11070.
6. Gorina-Careta, N., Kurkela, J.L.O., Hamalainen, J., Astikainen, P., & Escera, C. (2021) Neural generators of the frequency-following response elicited to stimuli of low and high frequency: A magnetoencephalographic (MEG) study. Neuroimage, 231, 117866.
7. Chandrasekaran, B. & Kraus, N. (2010) The scalp-recorded brainstem response to speech: neural origins and plasticity. Psychophysiology 47, 236–246.