がんの並行機能アノテーション
Scientific Reports volume 12、記事番号: 18487 (2022) この記事を引用
784 アクセス
3 オルトメトリック
メトリクスの詳細
バイオマーカーの発見や精密医療にエクソームシークエンシングを使用するには、ヌクレオチドレベルの変化をコードされたタンパク質の機能変化と結びつける必要があります。 しかし、何千もの癌関連ミスセンス変異、つまり有意性が不確かな変異体 (VUS) に機能的に注釈を付けるには、生化学的および機能的分析のために変異体タンパク質を精製するのは、法外なコストがかかり、非効率的です。 96 ウェル プレート内の小さな培養物と粗抽出物を使用した、多数の VUS の並行機能アノテーション (PFA) について説明します。 ヒストンメチルトランスフェラーゼファミリーのメンバーを使用して、癌関連変異のハイスループットな構造的および機能的アノテーションを実証します。 パラログの機能アノテーションを組み合わせることで、配列ベースの機能予測の精度を 90% 以上に向上させる 2 つの系統発生およびクラスター化パラメーターを発見しました。 我々の結果は、ヒストンメチルトランスフェラーゼの発癌/腫瘍抑制機能を定義する上での PFA の価値と、癌関連変異の影響を予測する際の配列ベースのアルゴリズムの精度を高めることを実証しています。
がん関連変異の機能的アノテーションは困難です 1,2。 ほとんどのミスセンス変異は機能が知られていない位置で発生するため、運転者変異と中立(乗客)変異の識別が妨げられます。 現在の機能アノテーション方法は、ヌクレオチドおよびアミノ酸 (aa) 配列の保存を使用して、変異の病原性を予測します 3,4,5。 検証は、野生型と比較したアミノ酸側鎖の変異体の多様性と、バックグラウンド変異率と比較したポジティブ選択の確率の統計的推定に依存しています6。 ただし、保存された aa を変更しても、必ずしも機能が変わるわけではありません。 構造情報と熱力学情報を機能予測に組み込むアルゴリズム 7,8 は、タンパク質の立体構造やリガンド結合状態に関する構造情報が不足しているため制限されます。 複合体中のタンパク質の機能に対するアミノ酸置換の影響を予測することは困難です。 タンパク質の特性がよく解明されている場合、予測は向上しますが、そのような情報を得るには、コストと時間がかかるタンパク質の精製と特性評価が必要です。 どの変異ががんを引き起こすかを知ることは、細胞および動物ベースの研究に優先順位を付ける上で極めて重要ですが、機能予測プログラムではこれらの高額な実験を確実に導くことはできません6,9。
タンパク質を精製せずに、癌関連の有意性が不明なミスセンス変異体(VUS)のハイスループット特性評価のための並列機能アノテーション(PFA)について説明します。 我々は、がんにおいて最も頻繁に変異する遺伝子の1つである3つの混合系統白血病(MLL)ファミリーヒストンH3リジン4(H3K4)メチルトランスフェラーゼによるPFAの価値を実証します(図S1A)10、11、12、13、14、15。 16、17、18、19、20。 MLL ファミリー酵素の変異は、H3K4 メチル化パターンのゲノム全体の異常に関連しており、悪性腫瘍を促進する異常な転写プログラムに関連しています 18、21、22、23。 何百ものMLL1-3 VUSのうち、ほとんどは機能が知られていないアミノ酸位置にあります(図S1B)。 われわれは、触媒作用を有する多様性抑制因子、ゼステ増強因子、トリソラックス(SET)ドメイン内またはその周囲の99個のがん関連ミスセンス変異をスクリーニングし、広く使用されている2つの機能予測プログラムと結果を比較した。 3 つの MLL パラログの機能アノテーションを使用して、2 つの系統発生パラメーターとクラスター化パラメーターを組み合わせることで、配列ベースの機能予測精度が 90% 以上に向上することを発見しました。 これらの結果は、バイオマーカーの発見と精密医療のために、がん関連変異の機能的影響を予測するための計算手法を改善するための基盤を提供します。
予測ツールが頻繁に変異する酵素ファミリーの臨床的に関連するミスセンス変異をどの程度適切に分類しているかをよりよく理解するために、我々はMLL1-3の触媒SETドメインのVUSを機能的に分析し(図1)、結果を広く使用されている3つの計算予測プログラムと比較しました。 MLL 酵素はヒストン H3 リジン 4 (H3K4) のメチル化を触媒します 24。 変化は、悪性腫瘍に関連するゲノム全体のメチル化異常に関連しています。 MLL1 ~ 3 は、複数のがんにおいて最もよく変異する遺伝子の 1 つです 25、26。 何百ものMLL1-3 VUSのうち、ほとんどは機能が知られていないアミノ酸位置にあります(図S1)。
並列機能アノテーション (PFA) アッセイのワークフロー。 (1) 大腸菌における野生型 (WT) および変異型 (MT) の組換え発現プラスミドを 5 ml 培養液で誘導しました。 (2) 培養ペレットを溶解し、清澄化しました。 粗抽出物は、クーマシー染色 SDS-PAGE および/またはウェスタンブロッティングを使用して、等量の組換えタンパク質に対して標準化されました。 大腸菌はヒストンをメチル化しないので、組換えタンパク質なしでは基質は修飾されず、ライセートがアッセイの酵素源となりました。 (3) PCR ストリップチューブ内のライセートによるアッセイは、活性型ヒストンメチルトランスフェラーゼ複合体 (WRAD) に必要なサブユニット、基質としてのビオチン化ヒストン H3 ペプチド (アミノ酸 1 ~ 20)、および放射性標識 S-アデノシルメチオニン ( 3H-SAM)。 (4) 反応液を、クエンチング試薬を含む市販のストレプトアビジン/シンチラントでコーティングされた 96 ウェル FlashPlates34 に移しました (ステップ 4)。 エンドポイントアッセイのクエンチング時間は、時間経過の線形範囲内でシグナル対ノイズ比が確実に収まるように、WT 酵素を使用して決定されました。 (5) プレートリーダーは、ストレプトアビジンによって捕捉されたメチル化ビオチン化ペプチドのシグナルをシンチラント付近で検出したため、取り込まれなかった 3H-SAM の除去は不要になりました。 (6) 結果を分析した。 H3K4me0、非メチル化 H3; H3K4me1、モノメチル化 H3。
我々は、癌における体細胞変異のカタログ( COSMIC) データベース 27 と、メイヨー クリニックのさまざまな起源の 308 個の腫瘍のエクソーム配列決定から得たものです 28。 私たちは、構造情報を注釈に組み込む多型表現型 v2 (PolyPhen-2) 機能予測サーバーである Functional Analysis Through Hidden Markov Models (v2.3) (FATHMM)29 のがん固有のオプションを使用して、各変異の機能的影響スコアを計算しました 7 、CancerVar の人工知能による腫瘍優先順位付け (OPAI) サーバー 30。 FATHMM は、デフォルトの疾患閾値を使用して、がんを引き起こす 4 つの変異を予測しました。 96% はパッセンジャー変異であると推定されました (補足ファイル 1)。 PolyPhen-2 スコアは、89 の変異がおそらく損傷を与え、5 が損傷の可能性があり、1 が良性であることを示唆しました。 プログラムは、1 つの良性/乗客および 4 つの癌/おそらく損傷を与える推論 (5%) については一致しましたが、残りの約 95% のミスセンス変異位置の機能推論には高い不一致がありました (図 2A)。その真の機能は不明です。 。 また、CancerVar を使用して 99 VUS の発がん性の可能性を予測しました (補足ファイル 1)。その結果、大多数 (82%) の発がん性の確率が不確実であることがわかりました (OPAI スコア < 0.95)。 プログラム間の意見の相違により、疾患における SET ドメイン変異の役割を理解する際の予測ツールを支援するハイスループット機能アッセイを開発することになりました。
重要性が不明な癌関連ヒストンメチルトランスフェラーゼ変異体 (VUS) の並列機能アノテーション (PFA)。 (A) 混合系統白血病 (MLL) VUS の FATHMM および PolyPhen-2 機能予測のベン図: 99 個の変異のうち 5 個で重複する予測がありました。 (B) 上、PDB 5F59、アミノ酸 4754 ~ 4911 に基づく PDBsum からの触媒 SET ドメイン二次構造マップ。 アルファヘリックス (H1-3)、ベータシート (β1-10) ベータヘアピンターン (赤色のヘアピンターン)、およびリガンド/金属結合残基: H3/SAH 結合 (赤色の黒四角)、SAH 結合 (青色の三角) が示されています。 )、亜鉛イオン結合(青塗り四角/緑塗り三角)。 下、シンチレーションカウンティングによる MLL3 VUS 変異の代表的な PFA。 消光は 30 分後に行われ、データは WT に対して正規化されました。 ピンクと紫、H3K4me0、H3K4me1 で開始されたアッセイ。 WT の 50% を超える活性を持つすべてのバリアントの破線と対応する陰影領域、それぞれ平均と標準偏差 (1σ)。 エラーバー、2 つの独立した実験からの標準偏差。 (C) SDS-PAGE のフルオログラフィーによる MLL3 VUS 変異の PFA からの代表的な結果。 上、クエンチされた酵素反応のクーマシー染色ゲル。 中央、H3K4me0 (非メチル化) または H3K4me1 (モノメチル化) ペプチドとの反応からのシグナル。 下はクーマシー染色したSDS-PAGEによるMLL3変異体の発現。 アッセイは図 1 で説明したとおりで、完全な酵素活性に必要な組換えサブユニットを制限して 31、32、33 、異なる MLL 発現による活性の変動を最小限に抑えました。 モノメチル化およびジメチル化の速度は、未修飾またはモノメチル化基質を使用して決定されました。 活性は組換え発現に依存しました(非誘導コントロール、UIC、レーン1では活性なし)。 レーン 2 ~ 11 は、代表的な野生型 (WT) および変異型 MLL3 複合体を示しており、活性の変動が発現の違いによって説明できないことが示されています。 図2Cのトリミングされていないバージョンを図S11に示す。
酵素活性に対する真の機能的影響を決定するために、変異型タンパク質と野生型タンパク質の酵素活性を迅速に比較するための、費用効果が高く、ハイスループットの PFA プラットフォームを開発しました。 PFA には、小規模培養物における野生型遺伝子と変異型遺伝子の並行発現が含まれます (図 1)。 我々は、大腸菌内の組換えプラスミドから野生型または変異型のSETドメインを発現させて、99個のVUSヒストンメチル化酵素すべての特性評価をモデルとして使用しました。 細胞溶解後、正規化された粗抽出物と 3H-S-アデノシルメチオニン (3H-SAM)、ビオチン化ヒストンペプチド基質、および補因子または相互作用タンパク質 (この場合、完全な酵素活性に必要な精製された組換えサブユニット) を組み合わせてアッセイを開始しました。 、33。 特定の時点で、反応液を、クエンチャーを含む市販のストレプトアビジン/シンチラントでコーティングされた 96 ウェル FlashPlates34 に移しました。 プレートリーダーは、反応シグナルを検出しました。この場合、シンチラントの近位のストレプトアビジンによって捕捉されたメチル化ビオチン化ペプチドが検出されました。 データは野生型酵素活性に対して正規化されました(図2Bおよび図S2、S3、S4)。 すべてのステップでは、標準的な PCR サーモサイクラーの 8 チャンネル ピペッターを使用し、高スループットの並列化を可能にしました。
結果を検証するために、反応をフルオログラフィーによって視覚化しました (図 2C)。 メチル化活性は組換え発現に依存し、非誘導対照では活性がありませんでした(レーン1)。 野生型および変異型 MLL3 複合体は、活性の変動が触媒ドメイン発現の違いによって説明されないことを示しました (レーン 2 ~ 11 および下のパネル)。 フルオログラフィーによる酵素活性の変動は、シンチレーション計数の結果と定性的に一致しました(図S5)。 さらに、以前に特徴付けられた変異のサブセットについて観察された相対活性の変化は文献 12、13、32、33、35、36、37、38、39 と一致しており、アッセイの検証が行われています。 PFA を特徴とする 99 個の VUS のうち、62% で機能喪失 (LOF) (野生型の 50% 未満の活性) が示され、3% で機能獲得 (GOF) が示され、35% で有意な変化は示されませんでした (図3A)。
意義不明のメチルトランスフェラーゼ癌関連変異体 (VUS) の構造機能アノテーション。 (A) 99 の混合系統白血病 (MLL) VUS の並行機能アノテーションからの、中立 (野生型 [WT] 様)、機能喪失 (LOF)、および機能獲得 (GOF) バリアントの割合。 (B) 3 つの MLL パラログの SET (活性部位含有) ドメインのクラスタル オメガ配列アラインメント。 グレー、ニュートラル。 緑、GOF。 赤、LOF; ピンク色、MLL1 変異はヒストン H3 リジン 4 (H3K4) のジメチル化を除去しますが、モノメチル化は除去しません。 PDBSum 二次構造のアノテーションは MLL1 に基づいています。 クラスター 1 ~ 5 のバーは、推定上のミスセンス変異クラスターを示します。 (C) 突然変異クラスターを示す MLL1 SET ドメイン (PDB コード 2W5Z) の表面表現。B) と同様に色付けされています。 SET-1ローブの非活性部位表面にマッピングされるクラスター2のLOF変異体には、MLL248、49、50、51、52、53、39、54、55にある場合、ヒトのカブキ症候群に関連する変異が含まれる。 突然変異は、触媒作用に必要な RBBP5/Ash2L ヘテロダイマーとの相互作用に必要な表面を破壊することにより、複雑なアセンブリと酵素活性を損ないます 39。 クラスター 3 は、直接接触する二葉構造の支点付近にある 6 つのヒト MLL 33 すべてにおいて、SET 活性に必須の高度に保存された「NHS」シグネチャ モチーフを持つ α ヘリックス 5 から β シート 7 までを包含します 44,61,62,63,64,64。補酵素結合ポケット塩基の S-アデノシルメチオニンに。 クラスター 4 LOF バリアントには、ドメイン ベースに沿った隣接する表面上の β シート 8 ~ 10 の残基が含まれます。 突然変異は、βシート 8 および 9 の溶媒にさらされていない表面上の埋もれたアミノ酸に影響を与えます (不安定化すると予測されています)。 MLL3 の 1 つの GOF バリアントはチロシン 4884 を置き換え、「Phe/Tyr スイッチ」活性部位の位置に挿入し、システイン 32、63、66、67、68、69、70、71、72、72 による生成物の特異性を決定します。 この変異体は、ポリコーム SET ドメイン EZH2 活性部位における癌の原因となる Y から C への置換と同様に、ジメチル化しますが、モノメチル化はしませんでした 71。 クラスター 5 は、4 つのシステインのうち 3 つが亜鉛原子に配位する SET ドメインの亜鉛結合ローブ (親指) を備えた SET 後ドメインを包含します (クラスター 3 から 4 番目)。 亜鉛は、補酵素結合ポケットのアデニン近位部分に不可欠です。 灰色のテキスト、SET-I およびポスト SET ローブ (メチルトランスフェラーゼ活性に重要)、および Kabuki 相互作用表面。 ヒストン H3 およびボール アンド スティック モデル、SET-I 葉上の活性部位の位置。 (D) 基質および補因子産物 S-アデノシルホモシステイン (SAH) の位置が示された、活性部位に集中する VUS 変異クラスターの拡大図。 (E) ドメイン特徴の位置。
バリアントの構造的および生化学的洞察を得るために、aa 保存と二次構造について注釈が付けられた CLUSTAL-Omega 配列アライメント 40 を使用し、単離された SET ドメインの X 線構造にマッピングしました(図 3B、C、図 S2、S3、S4)。 )41、42、43、44。
ほとんどの LOF 変異体は 5 つの一次構造要素の周りにクラスター化されていました (図 3B): クラスター 1 は β 鎖にマッピングされ、ループが介在し、SET ドメインの「手のひら」にある SAM 結合ポケットの一部を形成しました (図 3C) 、D、E)。 ここでの変異により、ドメインに対するβシートのパッキングが変化し、SAM 結合ポケットが破壊される可能性があります。 クラスター 1 LOF バリアントの位置は、SET ドメイン間および 3 つの MLL のうち 2 つだけで、さまざまな程度の aa 保存を示しました (図 3B)。 いくつかの中立変異(一部は高度に保存された位置にある)は、aa の保存が機能予測に必ずしも十分ではないことを示しました。
クラスター 2 には、基質特異性を決定すると考えられる領域の β 鎖間の残基が含まれていました 45 (図 3B ~ E)。 いくつかのLOF変異は、領域の反対側の表面にマッピングされました(図S2、S3、S4)。 活性部位近くの LOF 変異体は、ヒストンまたは補因子の結合を破壊した可能性があります。 マッピングされた推定 GOF 変異体の 1 つは、モノメチル化活性を変えることなくジメチル化の増加を示しました。 別の MLL では同じ位置が、酵素活性を変えることなく変異しました (図 3B、図 S2、S3)。 別のGOFバリアントは、モノメチル化を変化させることなくジメチル化を増加させ、ヒストンペプチド結合表面にマッピングしました(図S3)。 別の MLL では同じ位置が活性を変えることなく変異しました (図 2B、図 S4)。 一部のクラスター 2 LOF 変異体は非活性部位表面にマッピングされており、変異によりコア複合体の構築と酵素活性が損なわれることが実証されました (図 3C)39。この相互作用はクライオ EM によって確認されました (図 S6)55,56,57,57。 。 これらの観察は、相同サブユニットとの集合において異なる可能性がある複数のファミリーメンバーからの機能情報を組み込むことの重要性を強調している 33,38。
クラスター 3 には、補酵素結合ポケットの基部で SAM と直接接触する、酵素活性に必須の高度に保存された NHS モチーフが含まれています 33,42,59,60,61,62,62。 高い保存性と事前の生化学的情報が、NHS モチーフ変異に対する FATHMM および PolyPhen-2 からの正しい機能推論の原因となっている可能性があります。 しかし、これらのプログラムでは、構造情報に基づいて SAM/S-アデノシルホモシステイン結合ポケットの形成に関与するクラスター 1 バリアントと残りのクラスター 3 バリアントを含む残りの 95% のバリアントについて、LOF 変異と中立変異を区別できませんでした (図 1)。 3D)。
クラスター 4 の LOF 変異体には、SET ドメインの塩基に沿って隣接する表面にマッピングされる残基が含まれていました。 このクラスター内の LOF 変異は主に埋められた aa 位置に影響を及ぼし、不安定化すると予測されました。 1 つの GOF バリアントは、製品の特異性を決定する位置で活性部位に挿入される残基にありました 32、33、61、64、65、66、67、68、69、70、70。 この変異体は、リンパ腫の治療標的である癌の原因となる置換 71 と同様に、モノメチルトランスフェラーゼ活性が失われたものの、ジメチルトランスフェラーゼ活性を獲得した混合表現型を示しました 72。
クラスター 5 は、亜鉛結合ローブを形成し、補酵素結合ポケットの一部に重要な亜鉛を配位する 4 つのシステイン残基のうち 3 つを提供するドメインを包含しました (図 3D)。 この領域の LOF 変異体は、亜鉛結合ローブを不安定化し、SAM 結合を変化させる可能性があります。
機能的アノテーションプログラムがMLLファミリーVUSの生化学的変化をどの程度予測しているかを判断するために、野生型に対して正規化したメチルトランスフェラーゼ活性に対してFATHMM、PolyPhen-2、およびCancerVarスコアをプロットしました(図4A〜C)。 FATHMM スコアは 3 つの領域にクラスター化されました (図 4A)。 99 個のミスセンス変異のうち、真陽性 (TP) 予測を表す 3 個の活性は野生型の 50% 未満であり、FATHMM スコアはデフォルトの疾患閾値 (≤ − 0.75) を満たす29。 別のクラスター 3 の予測は偽陽性 (FP) 領域に分類され、アクティビティが 50% のしきい値をかろうじて超えていたため、割り当てが希薄になりました。 真陰性 (TN) 予測を表す別の領域は、変異の 45% を含み、活性が野生型の 50% を超え、FATHMM スコアが - 0.75 を超えていました。 偽陰性 (FN) 予測を表す 3 番目の領域 (変異の 48%) は、活性が野生型の 50% 未満であり、FATHMM スコアは疾患がないことを示していました。
有意性が不明な癌関連ミスセンス変異体 (VUS) の予測表現型と in vitro 表現型の比較。 (A) クラスターごとに色分けされた VUS の FATHMM スコア対相対活性 (変異型 [MT]/野生型 [WT])。 クラスター 1、2、4、および 5 は、野生型活性の 50% の上下でほぼ等しい密度を持ちます (水平の点線)。 垂直点線、FATHMM がんのデフォルト疾患閾値 ≤ − 0.75 (変異が疾患を引き起こす確実性が高い)。 白丸、5 つのクラスターに適合しなかった 12 個の中立変異。 赤い点、クラスター 3 の保存された「NHS」変異に対応する変異 (酵素活性に必須のモチーフ)。 高度に保存されたクラスター 3 の 3 つの残基は正しく真陽性 (TP) と呼ばれましたが、同様の活性損失にもかかわらず、FATHMM には残りのクラスター 3 の機能喪失変異体を呼び出す感度がありませんでした。 (B) PolyPhen-2 スコアと VUS の相対活性。 垂直線、PolyPhen-2 のデフォルトの疾患閾値: > 0.8「おそらく損傷」、0.2 ~ 0.8「おそらく損傷」、< 0.2 良性)。 (C) CancerVar OPAI スコアと VUS の相対活性。 垂直線、発がん性の確率が不確実な変異体のデフォルト閾値 (< 0.95)。 (D) 並列クラスター スコア (pClustScore) が低い (< 1.5) または高い (> 1.5) 場合の VUS 間の平均アクティビティの差のバイオリン プロット。 有意性は対応のない両側 t 検定から得られました。 破線、中央値。 点線、上位四分位数と下位四分位数。 (E) Variant ProxRatioEach スコアは、混合系統白血病 (MLL) 1 番号付けを使用してアミノ酸位置の関数としてプロットされた、各タンパク質の隣接するミスセンス変異の近接性を示します。 (F) ヒト SET1/MLL タンパク質のクラスター オメガ系統クラスター分析では、産物の特異性が分岐する 3 つのクレードが示されています (me1、2、3 はメチル化度) 33。 (G) PolyPhen-2 の偽陽性 (FP) および真陽性 (TP) アミノ酸位置におけるファミリー対クレード保存スコアの比較。 二元配置分散分析によりグループ内の平均を比較しました。 ****P < 0.0001; ns、P > 0.05。
さらにクラスターを分類すると、FATHMM は 5 つのクラスター グループ内にない 12 個の中立変異をすべて正しく呼び出しました。 FATHMM は、51 個の LOF 変異すべてのうち、機能的影響を正しく予測したのはわずか 6% であり、FN 推論は 94% でした。 FATHMM では、構造クラスター内のバリアントについてさまざまな結果が得られました。 3 つの高度に保存されたクラスター 3 残基は正しく TP と呼ばれました。 FATHMMは、同様の活性損失にもかかわらず、残りのLOFバリアントを呼び出す感度を欠いていました(図4A)。
PolyPhen-2 は、99 個のミスセンス変異を主に 2 つのグループに分類しました (図 4B): 95% のスコアが 0.8 以上で、「おそらく損傷している」と予測されました。 活性が野生型の 50% (全体の 53.5%) 未満である変異は、TP 予測を表しました。 活性が野生型の 50% を超える残りの 4 つ (全体の 42%) を除くすべてが FP 予測を表します。 PoylPhen-2 は構造情報を予測に組み込みました 7 が、FATHMM とは対照的に、FP と TN 推論を適切に区別する精度に欠けていました。
CancerVar は、ミスセンス変異を 4 つの領域にクラスター化しました(図 4C):53% の OPAI スコアが 0.95 以上で、発がん性があると予測されました。 野生型の 50% 未満の活性を持つ変異は TP (33%) および FN (19%) の予測を表し、一方、野生型の 50% を超える活性を持つ変異は FP (18%) および TN (29%) の予測を表します。
総合すると、プログラムは、アミノ酸位置のいくつかの変異については事前の機能情報と概ね一致していることを示していますが、予測に構造情報を組み込んでいたにもかかわらず、残りの変異の影響を正確に分類するのに苦労しました。 これらの結果は、正確な機能予測に最も重要な変数を特定するための追加のハイスループット生化学的アノテーション方法の必要性を強化します。
矛盾した FATHMM、PolyPhen-2、および CancerVar の結果は、主に aa 配列の保存に依存する予測プログラムを使用して VUS の機能的影響を推測することの困難さを強調しています。 MLL 酵素に対する機能的影響を予測するための最も重要な変数を特定するために、補足ファイル 2 には、物理化学的特性の変化を含む 14 の潜在的な説明パラメーターがあります。側鎖原子 (Δ原子) または水素結合ドナーまたはアクセプターの数、電荷、疎水性、側鎖の体積、および点突然変異時のアンフォールディング自由エネルギー (ΔΔG) の予測変化。 置換確率は BLOSUM62 マトリックス 73 から取得しました。
予測を改善するために、機能アノテーションの観察から推測される追加の変数を含めることをテストしました。 LOF 変異は特定の構造領域に非ランダムにクラスター化しており、クラスター化が機能の変化を示している可能性があることを示唆しています。 各タンパク質内の隣接するミスセンス変異の近接性 (ProxScoreEach) と、単一の aa 配列に投影された MLL ファミリー メンバーのすべてのミスセンス変異の集合体の近接性 (ProxRatioAll) から、ミスセンス変異の「並列クラスター スコア」(pClustScore) を計算しました。 )。 平均酵素活性は、クラスタースコアが高いミスセンス変異と低いクラスタースコアの場合で有意に低かった(P = 0.0001)(図4D)。 ミスセンス変異は、構造分析に対応する 4 つのグループに分類されました。 5番目のグループ(SET後のドメイン)は、ある程度のクラスタリングを示しました(図4E、図S7)。 ファミリーメンバー間のミスセンス変異の分布の違いは、ミスセンス変異のサブグループが各タンパク質に対して異なる影響を及ぼしていることを示唆しました。
多数の PolyPhen-2 FP 推論の理由を理解するために、すべての SET1 ファミリー SET ドメインと各系統サブファミリー (クレード) のメンバーのアライメントを比較した aa 保存スコアの違いを研究しました。 6 つのヒト SET1/MLL ファミリー メンバーを比較すると、標的遺伝子および産物の特異性 (H3K4 メチル化の数) において分岐する 3 つのクレードが示されました (図 4F)。 PolyPhen-2 TP 予測では、平均科とクレードの保存スコアにほとんど差がありませんでした。 FP 予測では、家族保存スコアがクレード保存スコアよりも大幅に低く (P < 0.0001) (図 4G)、オーソログ間での高い保存にもかかわらず、パラログ間で異なる位置が予測重要性を低下させたことを示しています。 系統発生情報を含めることで機能予測が改善されるかどうかをテストするために、Mutation Assessor74 を使用して各ミスセンス変異の機能影響スコア (FI スコア) を計算しました。 FI スコアは、各サブクレード内のオルソログ間の保存に基づいて「家族保存」スコア (VC スコア) と「特異性スコア」(VS スコア) を同時に計算する組み合わせエントロピー アプローチから導出されます 74,75。
クラスタリング パラメーター (ProxRatioEach、ProxRatioAll、pClustScore) と系統発生パラメーター (FI、VC、および VS スコア) はそれぞれ、野生型と比較した変異体の活性、Activity(Mut/WT) (Spearman の P \(\ル\) 0.01)。 ΔAtoms、ΔΔG、および BLOSUM62 パラメーターは、Activity(Mut/WT) と弱いながらも有意な関連性を示しました (Spearman の P = 0.04)。 他の物理化学パラメータには有意な相関はありませんでした(図S8)。 アクティビティ (Mut/WT) に対する変数の寄与は、14 パラメーターの主成分回帰によって決定されました。 相関関係と一致して、系統発生およびクラスター化パラメーター、BLOSUM62、ΔΔG、およびΔAtomsがメチル化率の変動の主な要因でした(図S9)。 これらの共変量のみを使用すると、集合的に変動の約76%を占める3つの主成分が特定されました(Activity(Mut / WT)で回帰した場合、R2 = 0.61、P < 0.0001、図S10)。 系統発生パラメータは、観察されたデータ変動の最大の割合 (37%) を占めました。 クラスタリング パラメータは PC2 (27%) に最も強く寄与し、ΔAtoms は PC3 (12%) に最も大きく寄与しました。 PC1 対 PC2 スコアにより、PC1 に沿って低酵素活性と高酵素活性の間でグループ分けが行われることが明らかになり (図 5A)、系統発生およびクラスター化パラメーターがメチル化率を最もよく予測することが示唆されました。 FI スコアは VC スコア、VS スコアと強く関連しており (スピアマン P < 0.0001)、さらなる分析のための系統発生パラメータでした。 pClustScore と ProxRatioAll および ProxRatioEach の間に強い関連があるため (Spearman の P < 0.0001)、pClustScore はクラスタリング パラメーターを表しました (図 S8)。
系統発生およびクラスター化パラメーターは、癌関連の有意性が不明なミスセンス変異体 (VUS) の機能的影響を予測します。 (A) 有意な系統発生 (FI スコア、VC スコア、VS スコア)、クラスタリング (pClustScore、ProxRatioAll、ProxRatioEach)、および物理化学 (ΔAtoms、Blosum62、ΔΔG) パラメーターの主成分 (PC) バイプロット。 赤、酵素活性が野生型 (WT) の 50% 以下の VUS。 青、活性が WT の 50% を超える VUS。 ミュート、ミュータント。 (B) MLL1-3 VUS の FI スコア、pClustScore、ΔAtoms、Blosum62、およびΔΔG パラメーターを使用した酵素活性の再帰的分割分類ツリー。 サークル、サブノードに分割できる内部ノード。 ボックス、ターミナルノード。 赤、活性が WT の 50% 以下の VUS。 青、活性が WT の 50% を超える VUS。 円、P 値入力ノード。 Activity(MT/WT) 値の箱ひげ図は終端ノードにあります。 (適合度 R2 = 0.65、RMSE = 0.22) (C) 10 倍相互検証スキームに基づくツリーの予測精度を示す混同行列。 再帰的分割アルゴリズムは、90% のトレーニング セットと 10% のテスト セットで、ランダムに選択されたデータ サブセットを使用して 10 ラウンドのフィッティングで繰り返されました 85。 DG) 実際のプロットと予測されたプロット。 X 軸、実際のアクティビティ。 y 軸は、回帰モデルに基づいて予測されたアクティビティです。 赤い斜線、アイデンティティの線。 破線、WT 活性が 50% 未満または 50% を超える VUS のカットオフ。 (D) 予測子としての FI-Score パラメーターと pClustScore パラメーター。 (E) 予測子としての FATHMM 推論スコア。 (F) 予測子としての PolyPhen-2 推論スコア。 (G) 予測因子としての CancerVar 人工知能による発がん性優先順位付け (OPAI) スコア。 調整された R2 値が示されています。
不偏再帰分割アルゴリズム 76 を使用した回帰木は、系統発生、クラスタリング、および物理パラメーターがミスセンス変異間のメチル化の変動にどのように影響するかを示しました。 活性が高い変異と低い変異を区別するための最初のブレークポイントは、パラログ間の保存性と系統学的差異の尺度である FI スコアに基づいていました (図 5B)。 FI スコアが 3.005 を超えるほとんどすべての VUS バリアントは、活性が非常に低い LOF として正しく分類されました (P < 0.001)。 FI スコア ≤ 3.005 の VUS バリアントの場合、pClustScore が高活性バリアントと低活性バリアントを区別する主な要因となりました。 Blosum62、ΔAtoms、ΔΔG パラメーターは有意ではありませんでした。 したがって、FI-Score と pClustScore を組み合わせると、FATHMM (R2 = 0.0002)、PolyPhen-2 (R2 = 0.05)、または CancerVar (R2 = 0.001) よりも、VUS 変異 (R2 = 0.63) の機能的影響の予測が大幅に向上しました (図5D–G)。
これら 2 つのパラメーターの予測力をテストするために、10 倍の相互検証を使用して再帰的分割アルゴリズムを繰り返しました 77。 FI-Score と pClustScore は、約 92% の VUS バリアントの機能的影響を正確に予測しました (図 5C、表 S1) (FATHMM 51%、PolyPhen-2 55%、CancerVar 62% 表 S2 と比較)。 したがって、機能的影響の予測は、関連するすべてのタンパク質に関するaa保存情報に加え、パラログの固有の機能を区別するオルソログ間の重要な位置の保存と、タンパク質フォールディングの機能領域を定義するミスセンス変異のクラスター化密度を組み合わせることで大幅に改善されました。
ヒストン修飾酵素を使用してモデル化された、酵素精製を行わずに VUS に機能的に注釈を付けるための迅速で経済的な PFA 方法について説明します。 99 個の変異に関する機能情報を収集するには、1 ~ 2 週間のベンチワークを要しました。 ミスセンス変異のサブグループの結果は以前の特徴付けと同様であり、PFA を検証しました。 予測アルゴリズムに反して、VUS 変異の 62% ではヒストン メチルトランスフェラーゼ活性の喪失が生じる一方、35% では観察可能な欠陥が示されず、それらはパッセンジャー変異であるか、アッセイに存在しない活性を妨害することが示唆されました。 VUS 変異のうち、3% は観察可能な機能獲得または機能の切り替えをもたらしました。その中には、EZH2 の SET ドメインで観察されたものと同様の製品特異性の変化を伴うものも含まれており、これは現在リンパ腫の治療薬の標的となっています 71,72 、78、79、80。 さらに、特徴づけられていないaa位置に新しいLOFおよびGOFバリアントを同定しました。
PFA は、酵素機能の変化に対する多数のミスセンス変異の並行スクリーニングに最も役立ちます。 PFA は、酵素活性、予備反応速度パラメーター (Vmax など) の推定、化合物の阻害または増強に敏感な変異体のスクリーニングに必要な場合に限り、非酵素サブユニットの変異をスクリーニングするために簡単に修飾できます。 S-アデノシル-ホモシステイン34の形成を測定する他の共役蛍光ベースのアッセイでは、オフターゲットのメチル化または蛍光消光を低減するために精製酵素が必要です。 PFA は粗抽出物、ビオチン化基質、および FlashPlate を使用するため、測定前にタンパク質を精製し、取り込まれなかった 3H-SAM を除去するステップが不要になります。 PFA は、大腸菌内で機能的に発現すれば、他のヒストン修飾酵素にも使用できます。
欠点としては、活動に必要な場合に翻訳後修飾ができないことが挙げられます。 このアッセイでは、酵素活性は変化しないが、アッセイに含まれないタンパク質または核酸との GOF 相互作用に影響を与える変異が見逃される可能性があります。 それにもかかわらず、PFA は配列に基づく計算予測に関する洞察を生み出し、VUS が癌に寄与するメカニズムを示唆しました。
3 つのパラログの機能アノテーションを組み合わせることで、3 つの計算予測プログラムに比べて機能予測を劇的に改善する配列ベースの系統発生パラメーターとクラスター化パラメーターを発見しました。 Polyphen-2 FP 変異位置のほとんどはオルソログ間で保存されているが、パラログ間では保存されていないことに気づきました。 これらの系統発生的な違いを無視する計算プログラムは、系統発生上のサブクレード内で高度に保存されているが、特定の機能のために分岐したサブクレード間で異なる aa 位置の重要性を低下させる可能性があります。 6 つのヒト SET1/MLL ファミリーメンバーが、製品特異性において分岐する 3 つの系統発生サブクレードに分類されるという我々の観察 (図 4E)33 は、FATHMM、PolyPhen-2、および CancerVar プログラムが MLL VUS の機能的影響を予測するのに苦労した理由を説明する可能性があります (表 S2) )。
機能予測における系統発生情報の重要性は、aa 位置の全体的な保存とパラログ間で異なる「特異性残基」の保存に基づいてミスセンス変異 FI スコアを提供する Mutation Assessor 74,75 を用いた組み合わせエントロピー アプローチで認識されました 74。 PFA の場合、FI スコアは、MLL 変異間のメチル化率の変動の最大割合 (36%、図 S10) を説明し、物理化学パラメータと BLOSUM62 パラメータを組み合わせたものと比較して大幅な改善を示し、メチル化率の変動が 10% 未満であることを説明しました。 FI スコアは必要でしたが、最良の機能予測には十分ではありませんでした。
ミスセンス突然変異近接解析により、機能ドメインのクラスター化に基づいて潜在的なドライバー遺伝子が特定され、これは正の選択を示しています。 いくつかのアプローチでは、配列ベースまたは構造ベースのアプローチを使用して、がん遺伝子のミスセンス変異クラスターを定量的に同定しています81、82、83。 ほとんどのタンパク質の構造情報が不足していることを考慮すると、配列ベースのパラメーターが望ましいです。 配列ベースのクラスタリング アルゴリズムは主に潜在的な癌遺伝子の特定に焦点を当てていますが、機能に必要な構造的特徴の特定にも役立ちます。 我々は、LOF 変異のほとんどが、基質や補因子の結合、または複雑な集合に関与する少なくとも 4 つの固有の構造要素の周囲に集まっていることを発見しました。 私たちは、不活化メカニズムの違いを反映している可能性のあるパラログ間のクラスタリング パターンの違いに気づきました。 Mutation Assessor のアナロジーに基づいて、これらの違いを考慮した VUS クラスタリング スコアを計算しました。 pClustScore パラメーターは、ProxRatioAll および/または ProxRatioEach パラメーターよりもメチル化率の予測に優れており (表 S3)、相補性を示しています。
FI-Score と pClustScore を組み合わせると、予測アルゴリズムでよく使用される物理化学パラメーターの寄与なしで、メチル化率の変動の約 70% が説明されました。 このレベルの変動は、VUS の機能的影響を最大 90% の精度で予測するのに十分でした。 これらの結果は、ファミリーメンバーの並行分析からの系統発生およびクラスター化パラメーターが、特に複数のパラログを持つファミリーの場合、VUS 変異の機能的影響を正確にモデル化するための重要な制約を提供することを示唆しています。
この研究は、タンパク質の構造と生化学に対するミスセンス変異の影響に関する知識が増えることで、全体的な機能アノテーションがどのように改善されるかを示しています。 同様のハイスループット手法を他のタンパク質に適用すると、疾患に関連するミスセンス変異の正確で広く適用可能な配列ベースの機能予測に必要なすべてのパラメーターを特定するのに役立ちます。
各野生型 MLL ファミリーメンバーの C 末端 260 aa をコードする pGST 発現プラスミドを鋳型として使用しました 33。 MLL ファミリー構築物は残基 MLL1 (3745 ~ 3969) (KMT2A、UniprotKB ID Q03164) で構成されていました。 MLL2 (別名 MLL4) (5319–5537) (KMT2B(D)、(UniprotKB ID O14686)、および MLL3 (4689–4911) (KMT2C、UniprotKB ID Q8NEZ4)。部位特異的突然変異誘発は、QuickChange II XL キット ( Agilent) 社内のサンガー シーケンスを使用して、意図した配列変異の存在と、意図しない突然変異がないことを確認しました。
形質転換された大腸菌細胞(Rosetta II (DE3) pLysS、Novagen)からのコロニーを使用して、50 μg/ml カルベニシリンおよび 25 μg/ml クロラムフェニコールを含む 5 ml TBII 培地に接種し、培養物を 30 °C で振盪しながら一晩増殖させました。 PFA の場合、0.1 ml の一晩培養物を、50 μg/ml カルベニシリンおよび 25 μg/ml クロラムフェニコールを含む 5 ml の新鮮な TBII に添加し、200 rpm で振盪しながら 37 ℃ で OD600 ~ 1.0 まで増殖させました。 培養物を氷上で30分間冷却し、1 mM IPTGで誘導し、16℃で200 rpmで24時間振盪した。 細胞を 4,000 rpm、4 °C での遠心分離によって回収し、ペレットを完全プロテアーゼ阻害剤 EDTA フリー錠剤 (Roche Applied Science)、1XBugBuster (Novagen)、および 0.25 mg/ml DNase A。再懸濁したペレットを、穏やかに回転させながら 4 °C で 3 時間インキュベートしました。 細胞溶解物は、4 °C、20,000 RPM での遠心分離によって収集されました。 上清を回収し、ペレットを廃棄した。 ライセートを等分し、急速冷凍し、-80 °C で保存しました。 各変異体の発現レベルは、Mini-PROTEAN TGX ゲル (Bio-Rad) を使用した 4 ~ 15% SDS PAGE およびクーマシー染色によって決定されました。 イメージングと濃度測定には Bio-Rad Chemidoc Imager を使用しました。 MLL コア複合体サブユニット WDR5、RbBP5、Ash2L、および DPY-30 の発現と精製は、以前に記載されているとおりでした 33。
GGK-ビオチンおよびC末端アミド化でタグ付けされた未修飾のH3K4モノメチル化ヒストンH3ペプチド(残基1~20)をGenScriptによって合成し、> 95%の純度まで精製しました。 メチルトランスフェラーゼアッセイでは、等量の野生型または変異型ライセートを、アッセイバッファー中で 3 µM WRAD、250 µM H3 ペプチド (未修飾またはモノメチル化)、および 1 ~ 2 µCi [3H]-SAM (PerkinElmer Life Sciences) とインキュベートしました。 20 mM トリス pH 8.5、1 mM TCEP、200 mM NaCl、1 μM ZnCl2)。 サンプルを 15 °C で 30 分間インキュベートしました。 空のベクター (pGST II) または未誘導の野生型プラスミドで形質転換した細胞からの溶解物は、陰性対照として機能しました。 反応を0.5M EDTA (1:1、v:v)で停止させた。 クエンチした反応液を、0.5 M EDTAおよび0.2 mg/ml BSAを含むアッセイバッファーを使用して200 μLにし、96ウェルのストレプトアビジンでコーティングされたFlashPlateマイクロプレート(PerkinElmer)に移した。 サンプルを 4 °C で一晩インキュベートし、ビオチン化 H3 ペプチドをストレプトアビジンでコーティングされた表面に結合させた後、Hidex Sense Plus マイクロプレート リーダー (LabLogic) でシンチレーション計測を行いました。 ゲルベースのフルオログラフィーアッセイでは、反応を SDS ローディングバッファーでクエンチし、4 ~ 12% BisTris SDS-PAGE (LifeTechnologies) により 200 V、30 分間分離しました。 ゲルをクーマシーで染色し、画像化した後、増強溶液(Enlightening、PerkinElmer Life Sciences)に室温で30分間入れた。 ゲルを一定の真空下で72℃で2.5時間乾燥させ、現像前に-80℃で6〜72時間フィルム(Eastman Kodak Co. Biomax MS Film)に露光しました。 ChemiDoc ImageLab (BioRad) ソフトウェアを使用した濃度測定を使用して、H3 ペプチドのメチル化を定量しました。
pClustScore は、Tamborero et al.81 のアプローチの修正を使用して計算された 2 つの近接パラメータの合計から導出されました。 ミスセンス変異近接パラメーターは、各変異の周囲のウィンドウ +/- 7 aa 内のミスセンス変異の数を数え、次に最も近いミスセンス変異までの距離で割ることによって計算されました。 突然変異のウィンドウは、Catalog of Somatic Mutations in Cancer (COSMIC) データベース内のすべての隣接する突然変異の 25% が互いに 7 aa 以内にあることを示す分析に基づいて選択されました。これは、最近傍距離の最初の 4 分の 1 に相当します 83。 ProxRatioEach は各タンパク質内のミスセンス変異の近接度に基づいて計算され、ProxRatioAll は単一配列に投影された 3 つのファミリー メンバーすべての結合変異について計算されました。 ProxRatioAll と ProxRatioEach は相関しており (図 S8)、これらが変異の近接性の相補的な尺度を提供することを示しています。 したがって、2 つの値を合計して、単一のクラスタリング パラメーター pClustScore を導き出しました。 重回帰分析により、pClustScore は、いずれかのパラメーターを単独で使用した場合、または合計せずに両方のパラメーターを使用した場合よりも、H3K4 メチル化率の予測がより正確であることが示されました (表 S3)。
主成分回帰分析は、MacOS 用の GraphPad Prism バージョン 9.3.0 (GraphPad Software、米国カリフォルニア州サンディエゴ) を使用して実行されました。 成分の選択は、合計分散の少なくとも 75% を説明する最大の固有値を持つ主成分に基づいて行われました。 再帰的パーティショニング ツリー回帰は、説明されているように R パッケージの R ベースの Web 実装を使用して実行されました 76,84。 モデルの検証は、データの 90% をトレーニング セットとして使用し、10% をモデルのテストに使用して、分位分類による 10 倍交差検証を使用して実行されました76。 検証は、ランダムに選択された別のトレーニング セットとテスト セットを使用して 10 回繰り返されました。
現在の研究中に生成されたデータおよび/または研究中に分析されたデータは、この公開された論文 (およびその補足情報ファイル) に含まれています。
Buniello, A. et al. 2019 年に公開されたゲノムワイド関連研究、ターゲット アレイおよび概要統計の NHGRI-EBI GWAS カタログ。Nucleic Acids Res. 47、D1005–D1012 (2019)。
論文 CAS PubMed Google Scholar
グリーンマン、C.ら。 ヒトがんゲノムにおける体細胞変異のパターン。 ネイチャー 446、153–158 (2007)。
論文 ADS CAS PubMed PubMed Central Google Scholar
シハブ、HA et al. 非コーディング配列およびコーディング配列の変異の機能的影響を予測するための統合的アプローチ。 バイオインフォマティクス 31、1536–1543 (2015)。
論文 CAS PubMed PubMed Central Google Scholar
キルヒャー、M.ら。 ヒトの遺伝子変異の相対的な病原性を推定するための一般的な枠組み。 ナット。 ジュネット。 46、310–315 (2014)。
論文 CAS PubMed PubMed Central Google Scholar
Ritchie, GR、Dunham, I.、Zeggini, E. & Flicek, P. 非コード配列変異体の機能的注釈。 ナット。 方法 11、294–296 (2014)。
論文 CAS PubMed PubMed Central Google Scholar
Itan, Y. & Casanova, JL 人間の遺伝的多様性の影響は予測できますか? 手順国立アカド。 科学。 USA 112、11426–11427 (2015)。
論文 ADS CAS PubMed PubMed Central Google Scholar
Adzhubei, IA et al. 有害なミスセンス変異を予測するための方法およびサーバー。 ナット。 方法 7、248–249 (2010)。
論文 CAS PubMed PubMed Central Google Scholar
カンブロフ、A. et al。 タンパク質構造における癌のミスセンス変異クラスタリングの包括的な評価。 手順国立アカド。 科学。 USA 112、E5486-5495 (2015)。
論文 ADS CAS PubMed PubMed Central Google Scholar
マルテロット、LG 他機能的に検証されたがん関連ミスセンス変異を使用した変異影響予測アルゴリズムのベンチマーク。 ジェノム。 バイオル。 15、484 (2014)。
記事 Google Scholar
ピュー、TJ 他髄芽腫のエクソーム配列決定により、サブタイプ特異的な体細胞変異が明らかになります。 Nature 488、106–110 (2012)。
論文 ADS CAS PubMed PubMed Central Google Scholar
ジョーンズ、DT 他髄芽腫の根底にあるゲノムの複雑性を解剖する。 Nature 488、100–105 (2012)。
論文 ADS CAS PubMed PubMed Central Google Scholar
Kudithipudi, S. & Jeltsch, A. ヒトタンパク質リジンメチルトランスフェラーゼにおける体細胞癌変異の役割。 ビオチム。 生物物理学。 Acta 1846、366–379 (2014)。
CAS PubMed Google Scholar
Weirich, S.、Kudithipudi, S. & Jeltsch, A. MLL1 ヒストンメチルトランスフェラーゼの体細胞がん変異は、その酵素活性と WDR5/RBBP5/ASH2L 複合体への依存性を調節します。 モル。 オンコル。 11、373–387 (2017)。
論文 CAS PubMed PubMed Central Google Scholar
Rong, G. et al. 突然変異解析による転移性乳がんの予後指標としての DNA 損傷反応。 アン。 翻訳。 医学。 9、220 (2021)。
論文 CAS PubMed PubMed Central Google Scholar
チャン、YCら。 ターゲット次世代シークエンシングにより、トリプルネガティブ骨髄増殖性腫瘍における新規変異が同定されました。 医学。 オンコル。 34、83 (2017)。
論文 PubMed Google Scholar
Dai、W.ら。 全エクソーム配列決定により、食道扁平上皮癌の転移の根底にある重要な遺伝子が明らかになります。 J.パソール。 242、500–510 (2017)。
論文 CAS PubMed Google Scholar
ダフォンセカ、V. 他診断および予後の目的のための潜在的なドライバー変異として胆嚢癌における変化した遺伝子の同定: コンピューターによるアプローチ。 がん情報。 19、1176935120922154 (2020)。
記事 PubMed PubMed Central Google Scholar
チェン、C.ら。 MLL3 は、急性骨髄性白血病におけるハプロ不全 7q 腫瘍抑制因子です。 Cancer Cell 25、652–665 (2014)。
記事 PubMed PubMed Central Google Scholar
Lohr、JG et al. 全エクソームシーケンスによるびまん性大細胞型 B 細胞リンパ腫 (DLBCL) における体細胞変異の発見と優先順位付け。 手順国立アカド。 科学。 USA 109、3879–3884 (2012)。
論文 ADS CAS PubMed PubMed Central Google Scholar
Rao, RC & Dou, Y. がんにおけるハイジャック: メチルトランスフェラーゼの KMT2 (MLL) ファミリー。 ナット。 Rev. Cancer 15、334–346 (2015)。
論文 CAS PubMed PubMed Central Google Scholar
ウー、HTら。 ルテオリンによって誘導される MLL3 は、H3K4 モノメチル化と PI3K/AKT/mTOR 経路の抑制を通じて、タモキシフェン耐性乳がん細胞にアポトーシスを引き起こします。 午前。 J. チン医学。 48、1221–1241 (2020)。
論文 CAS PubMed Google Scholar
Rampias, T. et al. リジン特異的メチルトランスフェラーゼ KMT2C/MLL3 は、がんの DNA 修復コンポーネントを制御します。 EMBO Rep. 20(3)、e46821 (2019)。
記事 PubMed PubMed Central Google Scholar
ウォン、SHら。 H3K4 メチル エピゲノムは、白血病幹細胞の発癌能を制御します。 Cancer Cell 28、198–209 (2015)。
論文 CAS PubMed PubMed Central Google Scholar
Shilatifard, A. ヒストン H3K4 メチラーゼの COMPASS ファミリー: 発生および疾患の発症における調節機構。 アンヌ。 Biochem.Rev. 81、65–95 (2012)。
論文 CAS PubMed PubMed Central Google Scholar
Gao、J.ら。 cBioPortal を使用した、複雑ながんゲノミクスと臨床プロファイルの統合分析。 科学。 信号。 https://doi.org/10.1126/scisignal.2004088 (2013)。
記事 PubMed PubMed Central Google Scholar
ムンテアン、AG およびヘス、JL 混合系統白血病の病因。 アンヌ。 パソール牧師。 7、283–301 (2012)。
論文 CAS PubMed Google Scholar
テイト、JG 他 COSMIC: がんにおける体細胞変異のカタログ。 核酸研究所 47、D941–D947 (2019)。
論文 CAS PubMed Google Scholar
イーガン、JB 他 (2017) 重要性不明のエクソーム配列由来変異体の分子モデリングと機能分析により、胆管癌における新規の構成的に活性な FGFR2 変異体が特定されました。 JCO プレシス オンコル https://doi.org/10.1200/PO.17.000182017。
Shihab, HA、Gough, J.、Cooper, DN、Day, IN & Gaunt, TR 癌関連アミノ酸置換の機能的影響を予測する。 バイオインフォマティクス 29、1504–1510 (2013)。
論文 CAS PubMed PubMed Central Google Scholar
リー、Qら。 CancerVar: がんの体細胞変異を臨床的に解釈するための人工知能を活用したプラットフォーム。 科学。 上級 8、eabj1624 (2022)。
論文 CAS PubMed PubMed Central Google Scholar
Dou, Y. et al. MLL1 H3K4 メチルトランスフェラーゼ活性のコアコンポーネントによる制御。 ナット。 構造体。 モル。 バイオル。 13、713–719 (2006)。
論文 CAS PubMed Google Scholar
Patel, A.、Dharmarajan, V.、Vought, VE & Cosgrove, MS ヒト混合系統白血病タンパク質 1 (MLL1) コア複合体による複数のリジンメチル化のメカニズムについて。 J.Biol. 化学。 284、24242–24256 (2009)。
論文 CAS PubMed PubMed Central Google Scholar
Shinsky, SA、Monbeith, KE、Viggiano, S. & Cosgrove, MS ヒストンのメチル化に関与するヒト SET1 ファミリーのコア複合体の生化学的再構成と系統学的比較。 J.Biol. 化学。 290、6361–6375 (2015)。
論文 CAS PubMed PubMed Central Google Scholar
Quinn, AM & Simeonov, A. ヒストンのメチル化を調節するタンパク質の活性分析方法。 カー。 化学。 ジェノム。 5、95–105 (2011)。
記事 CAS Google Scholar
Patel, A.、Vought, VE、Dharmarajan, V. & Cosgrove, MS 混合系統白血病タンパク質-1 コア複合体の構築と酵素活性に重要な保存されたアルギニン含有モチーフ。 J.Biol. 化学。 283、32162–32175 (2008)。
論文 CAS PubMed Google Scholar
Patel, A.、Vought, VE、Dharmarajan, V. & Cosgrove, MS 混合系統白血病タンパク質 1 (MLL1) コア複合体による連続的なヌクレオソーム ヒストン H3 メチル化に必要な、新規の非 SET ドメイン マルチサブユニット メチルトランスフェラーゼ。 J.Biol. 化学。 286、3359–3369 (2011)。
論文 CAS PubMed Google Scholar
パテル、A.ら。 混合系統白血病-1 (MLL1) コア複合体内の自動メチル化活性は、複数のヒストン H3 リジン 4 メチル化の「2 活性部位」モデルを支持する証拠を明らかにします。 J.Biol. 化学。 https://doi.org/10.1074/jbc.M113.501064 (2013)。
記事 PubMed PubMed Central Google Scholar
サウスカロライナ州シンスキーおよびミシシッピ州コスグローブ 混合系統白血病 3 (MLL3) ヒストンメチルトランスフェラーゼ複合体内の WD-40 リピートタンパク質 5 (WDR5) サブユニットの独特の役割。 J.Biol. 化学。 290、25819–25833 (2015)。
論文 CAS PubMed PubMed Central Google Scholar
S.A.シンスキーら。 MLLファミリーコア複合体内のMLL1とRbBP5/Ash2Lヘテロ二量体の相互作用に重要な非活性部位SETドメイン表面。 J.Mol. バイオル。 426、2283–2299 (2014)。
論文 CAS PubMed PubMed Central Google Scholar
Sievers, F. & Higgins, DG クラスターオメガ、非常に多数の配列の正確なアライメント。 方法 Mol. バイオル。 1079、105–116 (2014)。
論文 CAS PubMed Google Scholar
Laskowski、RA PDB新しいものを合計します。 核酸研究所 37、D355-359 (2009)。
論文 CAS PubMed Google Scholar
Southall、SM、Wong、PS、Odho、Z.、Roe、SM & Wilson、JR MLL1 SET ドメイン活性およびエピジェネティック マークの認識のための追加因子の要件の構造的基礎。 モル。 セル 33、181–191 (2009)。
論文 CAS PubMed Google Scholar
Zhang、Y.ら。 MLL ファミリー SET ドメインの進化する触媒特性。 構造 23、1921 ~ 1933 年 (2015)。
論文 CAS PubMed PubMed Central Google Scholar
リー、Yら。 MLLファミリーメチルトランスフェラーゼの活性制御の構造基盤。 ネイチャー 530、447–452 (2016)。
論文 ADS CAS PubMed PubMed Central Google Scholar
Xiao、B.、Wilson、JRおよびGamblin、SJ SETドメインおよびヒストンメチル化。 カー。 意見。 構造体。 バイオル。 13、699–705 (2003)。
論文 CAS PubMed Google Scholar
バンカ、S.ら。 カブキ症候群患者における MLL2 モザイク変異と遺伝子内欠失重複。 クリン。 ジュネット。 83、467–471 (2013)。
論文 CAS PubMed Google Scholar
バンカ、S.ら。 カブキ症候群はどの程度遺伝的に不均一なのでしょうか? 116 人の患者における MLL2 検査、変異および表現型スペクトルのレビューと分析。 ユーロ。 J. ハム。 ジュネット。 20、381–388 (2012)。
論文 CAS PubMed Google Scholar
Cocciadiferro, D. et al. カブキ症候群患者における KMT2D ミスセンス変異の解剖。 ハム。 モル。 ジュネット。 27、3651–3668 (2018)。
論文 CAS PubMed PubMed Central Google Scholar
ハンニバル、MC 他カブキ症候群 110 例における MLL2 (ALR) 変異のスペクトル。 午前。 J.Med. ジュネット。 A 155A、1511–1516 (2011)。
論文 PubMed Google Scholar
ニューメキシコ州中田幸光ほかカブキ症候群の最初のブラジル人家族における MLL2 遺伝子の分析。 午前。 J.Med. ジュネット。 A 158A、2003 ~ 2008 (2012)。
論文 PubMed Google Scholar
リー、Yら。 カブキ症候群患者における突然変異スクリーニング。 ハム。 ジュネット。 130、715–724 (2011)。
論文 CAS PubMed Google Scholar
Ng、SBら。 エクソーム配列決定により、MLL2 変異がカブキ症候群の原因であることが特定されました。 ナット。 ジュネット。 42、790–793 (2010)。
論文 CAS PubMed PubMed Central Google Scholar
Paulussen, AD et al. カブキ症候群患者 45 人の MLL2 変異スペクトル。 ハム。 ムタット。 32、E2018-2025 (2011)。
論文 CAS PubMed Google Scholar
Worden, EJ、Zhang, X. & Wolberger, C. H2B ユビキチン化ヌクレオソームの COMPASS 認識の構造基盤。 Elife 9、e53199 (2020)。
論文 CAS PubMed PubMed Central Google Scholar
Xue、H.ら。 MLL メチルトランスフェラーゼによるヌクレオソームの認識と修飾の構造基盤。 ネイチャー 573、445–449 (2019)。
論文 ADS CAS PubMed Google Scholar
パーク、SHら。 ヌクレオソームに結合したヒト MLL1 コア複合体の Cryo-EM 構造。 ナット。 共通。 10、5540 (2019)。
論文 ADS CAS PubMed PubMed Central Google Scholar
Qu、Q.ら。 COMPASS ヒストン H3K4 メチルトランスフェラーゼ複合体の構造と立体配座ダイナミクス。 セル 174 (1117–1126)、e1112 (2018)。
Google スカラー
Rea, S. et al. 部位特異的ヒストンH3メチルトランスフェラーゼによるクロマチン構造の制御。 Nature 406、593–599 (2000)。
論文 ADS CAS PubMed Google Scholar
Trievel、RC、Beach、BM、Dirk、LM、Houtz、RL & Hurley、JH SET ドメインタンパク質メチルトランスフェラーゼの構造と触媒機構。 セル 111、91–103 (2002)。
論文 CAS PubMed Google Scholar
ウィルソン、JR 他ヒストンメチル基転移酵素SET7/9の結晶構造と機能解析。 セル 111、105–115 (2002)。
論文 CAS PubMed Google Scholar
Zhang、X.ら。 アカパンカビのSETドメインタンパク質DIM-5、ヒストンH3リジンメチルトランスフェラーゼの構造。 セル 111、117 ~ 127 (2002)。
論文 CAS PubMed PubMed Central Google Scholar
Dillon, SC、Zhang, X.、Trievel, RC & Cheng, X. SET ドメインタンパク質スーパーファミリー: タンパク質リジンメチルトランスフェラーゼ。 ジェノム。 バイオル。 6、227 (2005)。
記事 Google Scholar
Zhang、X.ら。 ヒストンリジンメチルトランスフェラーゼの産物特異性の構造的基礎。 モル。 セル 12、177–185 (2003)。
記事 PubMed PubMed Central Google Scholar
コリンズ、RE et al. ヒストンリジンメチルトランスフェラーゼの生成物特異性を制御するPhe/Tyrスイッチのインビトロおよびインビボ分析。 J.Biol. 化学。 280、5563–5570 (2005)。
論文 CAS PubMed Google Scholar
Couture、JF、Dirk、LM、Brunzelle、JS、Houtz、RL & Trievel、RC SET ドメインタンパク質メチルトランスフェラーゼの産物特異性の構造的起源。 手順国立アカド。 科学。 USA 105、20659–20664 (2008)。
論文 ADS CAS PubMed PubMed Central Google Scholar
Zhang, X. & Bruice, TC SET ドメインタンパク質リジンメチルトランスフェラーゼの酵素機構と生成物特異性。 手順国立アカド。 科学。 USA 105、5728–5732 (2008)。
論文 ADS CAS PubMed PubMed Central Google Scholar
Qian, C. et al. ウイルスのヒストン H3 リジン 27 メチルトランスフェラーゼの特異性と触媒作用に関する構造的洞察。 J.Mol. バイオル。 359、86–96 (2006)。
論文 CAS PubMed Google Scholar
Trievel, RC、Flynn, EM、Houtz, RL & Hurley, JH SET ドメイン酵素 Rubisco LSMT による複数のリジンメチル化のメカニズム。 ナット。 構造体。 バイオル。 10、545–552 (2003)。
論文 CAS PubMed Google Scholar
Xiao、B.ら。 ヒストンメチルトランスフェラーゼ Pr-Set7 の特異性とメカニズム。 遺伝子開発 19、1444–1454 (2005)。
論文 CAS PubMed PubMed Central Google Scholar
Xiao、B.ら。 ヒトヒストンメチルトランスフェラーゼSET7/9の構造と触媒機構。 ネイチャー 421、652–656 (2003)。
論文 ADS CAS PubMed Google Scholar
ウィグル、TJ 他 EZH2 の Y641C 変異は、ヒストン H3 リジン 27 メチル化状態の基質特異性を変化させます。 FEBSレター。 585、3011–3014 (2011)。
論文 CAS PubMed Google Scholar
モーリン、RD、アーサー、SE、アスリーン、S。リンパ腫の治療は少し簡単になりました。 血液Adv. 5、2256–2263 (2021)。
論文 CAS PubMed PubMed Central Google Scholar
Henikoff, S. & Henikoff, JG タンパク質ブロックからのアミノ酸置換行列。 手順国立アカド。 科学。 USA 89、10915–10919 (1992)。
論文 ADS CAS PubMed PubMed Central Google Scholar
Reva, B.、Antipin, Y. & Sander, C. タンパク質変異の機能的影響の予測: 癌ゲノミクスへの応用。 核酸研究所 39、e118 (2011)。
論文 CAS PubMed PubMed Central Google Scholar
Reva, B.、Antipin, Y. & Sander, C. 組み合わせエントロピー最適化によって明らかにされたタンパク質機能の決定要因。 ジェノム。 バイオル。 8、R232 (2007)。
記事 Google Scholar
Wessa, P. 無料統計ソフトウェア (v1.2.1) の再帰分割 (回帰ツリー) (v1.0.5)。 研究開発および教育部門。 http://www.wessa.net/rwasp_regression_trees.wasp/ 2021 年 12 月 12 日にアクセス (2016 年)。
Vihinen, M. 予測手法のパフォーマンスをどのように評価するか? 変動効果分析における測定値とその解釈。 BMCジェノム。 13(補足 4)、S2 (2012)。
記事 Google Scholar
モリン、RD et al. 胚中心起源の濾胞性およびびまん性大細胞型 B 細胞リンパ腫における EZH2 (Tyr641) を変化させる体細胞変異。 ナット。 ジュネット。 42、181–185 (2010)。
論文 CAS PubMed PubMed Central Google Scholar
スワルム、BMら。 野生型と疾患関連変異体 EZH2 間の反応共役。 ACS Chem. バイオル。 9、2459–2464 (2014)。
論文 CAS PubMed Google Scholar
ヤップ、DB 他 EZH2 Y641 の体細胞変異は、選択的に変化する PRC2 触媒活性のメカニズムを通じて主に作用し、H3K27 のトリメチル化を増加させます。 Blood 117、2451–2459 (2011)。
論文 CAS PubMed PubMed Central Google Scholar
Tamborero, D.、Gonzalez-Perez, A. & Lopez-Bigas, N. OncodriveCLUST: 体細胞変異の位置クラスタリングを利用してがん遺伝子を特定します。 バイオインフォマティクス 29、2238–2244 (2013)。
論文 CAS PubMed Google Scholar
Porta-Pardo, E. & Godzik, A. e-Driver: がんを引き起こすタンパク質領域を特定する新しい方法。 バイオインフォマティクス 30、3109–3114 (2014)。
論文 CAS PubMed PubMed Central Google Scholar
ディーズ、ND et al. MuSiC: がんゲノムにおける突然変異の重要性を特定。 ジェノム。 解像度 22、1589–1598 (2012)。
記事 CAS Google Scholar
Everitt, BS & Hothorn, T. R を使用した統計分析ハンドブック 第 2 版 (CRCプレス、2009年)。
数学 Google Scholar
Kohavi, R. 精度推定とモデル選択のための相互検証とブートストラップの研究。 手順内部。 Jt. 会議アーティフ。 知性。 2、1137–1143 (1995)。
Google スカラー
リファレンスをダウンロードする
有益な議論をしていただいた Steve Hanes、Bruce Knutson、Jimmy Hougland に感謝します。 原稿を批判的に読んでくれたアン・スマードンとマイケル・コネリー、そして編集してくれたクリス・タチバナに感謝します。 この研究は、NIH R01 CA140522 および CNY から MSC へのキャロル M. ボールドウィン乳がん研究基金から資金提供を受けました。
生化学および分子生物学部、ニューヨーク州立大学 (SUNY) アップステート医科大学、4261 Weiskotten Hall、Syracuse、NY、13210、USA
アシュリー・J・カニング、スーザン・ヴィジャーノ、マイケル・S・コスグローブ
米国ミネソタ州ロチェスター、メイヨークリニック、腫瘍学研究部門、シュルツ新規治療センター
マーティン・E・フェルナンデス=ザピコ
PubMed Google Scholar でこの著者を検索することもできます
PubMed Google Scholar でこの著者を検索することもできます
PubMed Google Scholar でこの著者を検索することもできます
PubMed Google Scholar でこの著者を検索することもできます
AJC と MSC はデータ分析を実行し、原稿を作成しました。 SV はデータを収集し、MSC と MFZ が研究を概念化しました。 すべての著者が編集上の改訂に貢献しました。
マイケル・S・コスグローブ氏への通信。
著者らは競合する利害関係を宣言していません。
シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。
オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。
転載と許可
Canning, AJ、Viggiano, S.、Fernandez-Zapico, ME 他ヒストンメチルトランスフェラーゼにおける癌関連ミスセンス変異の並行機能アノテーション。 Sci Rep 12、18487 (2022)。 https://doi.org/10.1038/s41598-022-23229-2
引用をダウンロード
受信日: 2022 年 6 月 10 日
受理日: 2022 年 10 月 27 日
公開日: 2022 年 11 月 2 日
DOI: https://doi.org/10.1038/s41598-022-23229-2
次のリンクを共有すると、誰でもこのコンテンツを読むことができます。
申し訳ございませんが、現在この記事の共有リンクは利用できません。
Springer Nature SharedIt コンテンツ共有イニシアチブによって提供
コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。