Burger line Burger line Burger line
Logo Logo Logo
Burger line Burger line Burger line
メニュー
S'identifier
S'identifier

フォーカスされたライブラリ

フォーカスされたライブラリ

焦点を絞ったライブラリ作成のコンピューターベースの方法


シリコン脳

今日、インシリコ ドラッグ デザイン (CADD) は、ChemDiv を含む製薬業界のリーダーの大多数によって使用されています。 ここでは、CADD を使用して特定のライブラリを作成する 3 つの例を示します。


リカーリング ニューラル ネットワーク (RNN)

急速に発展している CADD 手法の 1 つに RNN が含まれます。RNN では、トレーニング後にネットワークが入力と同様の出力、つまり、学習データセット内のものを模倣した新しい分子構造を生成します。 

記事 [1] では、転移学習による焦点を絞ったライブラリの自動作成について説明しました。つまり、最初に大規模なセット (この場合は分子のセットですが、概念は分子に限定されません) でトレーニングし、次にチューニングします。 リード最適化のためのより小さなサンプルを使用して検討されました。

ChEMBL データセットを使用して RNN をトレーニングした後、医薬品化学ワークフローで通常発生するものを模倣する転送セットが選択されました。

選択されたすべての指標のうち、ネットワークのパフォーマンスを評価するための鍵となったのは、ユニークノベルティ スコアと化学的近接性スコアの 2 つです。

少し直感に反して、小さなデータセットはより多くのトレーニングを必要とし、大きなデータセットはより少ないサイクルで問題ありませんでした。 トレーニング データがより均質であるため、フラグメント数が少ない (つまり、データセット内の異なるグループ (フラグメント) が少ないことを意味します) と、一意性が低くなります。

これらの結果を次の表に示します (ヘッダー番号は完了したエポック (つまり、サイクル) を示し、セルは出力のどのくらいの割合で、低い (4 分の 1 未満) ユニーク ノベルティ スコアを持っていたかを示します)。


<本体> 83

SIFt

CADD のもう 1 つの一般的な手法は、SBF (構造ベース フォーカシング) です。この手法では、特定の相互作用制約を基礎として使用して、ターゲットに結合できる新しい化合物を設計します。

記事 [2] で、研究者は大規模なデータ分析と視覚化のための方法、つまり構造情報フィンガープリント (SIFt) を開発しました。 分子の三次元的性質をより効果的に活用するために、r-SIFt が開発されました。「r」は異なる R グループを指します。

仮想ライブラリとドッキング ポーズを組み立てた後、Pipeline Pilot を介して 2 次元記述子が検出され、その時点で r-SIFt が生成され、バインディング パラメーターがフィンガープリントに統合されました。 最高の Cscores (MAP キナーゼ p38 阻害剤) を持つ 10 のポーズについて、r-SIFts が続いて生成され、Tanimoto 係数の計算を通じて選択された最良のポーズが使用されました。

結果は、以前に作成された r-SIFT を使用して作成された決定木の予測精度を測定することによって評価されました。

従来のツールキットと組み合わせると、r-SIFt は分子の特定の部分を拡大して視覚化するための優れたツールであることが証明されました。 次の図は、p38 阻害剤がどのように似ているかを示しており、さらに調べると違いが明らかになります。

フォーカス ライブラリ

b は最適なドッキング ポーズのオーバーレイです (c ~ f は p38 阻害剤、g はそうではありません)。 c の共結晶構造は黄色の線で示されています。  阻害剤も同様の方法で結合します。紫色の部分はヒンジの近くにあり、青色の部分は疎水性ポケットに集中しています。

フォーカス ライブラリ

構造と R グループ。 1-5 は前の図の c-g に対応します。

つまり、1 の R2 (紫色の c) は、他のものよりもヒンジとの接触が多く、これは以前の
所見。 小さい 3-フルオロフェノール R1 と比較して 1 のトリフルオロベンゼン R1 は、疎水性領域での相互作用の程度が高いことを説明しています。

多目的遺伝的アルゴリズム

多目的遺伝的アルゴリズム (MOGA) は、仮想空間でソリューションを検索し、異なるターゲット間の接続を提示するプログラムである MoSELECT の基盤として採用されました [3]。

多くの目的を持つタスクには、さまざまな解決策があり、それぞれに異なるトレードオフがあることがよくあります。 標準的な遺伝的アルゴリズムは、これらの行を個別に検索しますが、MOGA は「優位性」の考え方を利用して同時に検索します。

多目的遺伝的アルゴリズム

タスクは、f1 と f2 を最小化することです。 塗りつぶされた円は、非支配的な回答に対するものです。つまり、両方の目標に対してより良い解決策はありません。 空のドットが支配的であり、数字は「支配者」 (より良い解決策) がいくつ存在するかを示しています。

2-アミノチアゾール ライブラリからランダムな分子の焦点を絞ったライブラリを作成し、類似性 (デイライト フィンガープリントとタニモト係数によって測定) とコストを最適化する作業を行うと、標準的な遺伝的アルゴリズムを使用した SELECT が提供されました。 一方的に適切な解決策のみ – 平均 0,832; 48 米ドル 289,4 または 0,696。 1 675,2. 妥協点を達成する唯一の方法、つまり骨の折れる重みの選択は、このような釣り合いの取れていない目標には困難です。 MoSELECT は、単一のソリューションを提供するのではなく、非支配的な回答のファミリー全体を作成し、妥協点を決定する際のより簡単な選択を可能にします。

多目的遺伝的アルゴリズム
3 番目の図の拡大版であり、ソリューションのファミリー全体が示されています。

結論

全体として、インシリコ技術は製薬業界において非常に価値のあるツールです。 
ChemDiv は、仮想スクリーニング、ドッキング、hit2lead 最適化などを含む、化学情報学の分野で一流の CADD サービスを提供しています。  


文学

[1] RNN 転移学習ベースのフォーカス ライブラリの分子生成のガイドライン。 Amabilino et al., Journal of Chemical Information and Modeling  2020, 60, 12, 5699–5713
[2] タンパク質 - リガンド相互作用を用いた標的指向ライブラリーの知識ベースの設計

0 items in Cart
Cart Subtotal:
Aller au panier
Vous pourrez payer en ligne ou demander un devis
ファイル名 フラグ数 5 10 12 15 17 20
DHODフル 66 -- 1 59 91 96 100
METAP2 フル 59 -- 60 78 88 91 100
MMP-12 フル 31 33 66 80 94 99 100
P2X7 フル 131 -- -- -- 18 78 99
SLC22A12 フル 49 -- 75 98 100 100
DHODH サブセット 41 -- 46 62 88 98 100
METAP2 サブセット 40 -- 60 76 92 100 100
MMP-12 サブセット 22 50 80 87 97 100 100
P2X7 サブセット 64 -- 34 85 95 99 100
SLC22A12 サブセット 32 13 75 88 100 100 100
US-20090018134 33 8 58 79 91 93 99
US-20090286778 123 -- 21 55 75 81 83
US-20100016279 73 -- 82 97 99 100 100
US-20120157425 91 1 85 92 99 100 100
WO-2010079443 54 -- -- -- 8 60 92
WO-2011075515 137 -- 2 42 89 93 100
WO-2012053186 44 1 66 87 94 100 100
WO-2012067965 110 -- 34 85 97 98 100