藥物研發(fā)中對(duì)專利數(shù)據(jù)的挖掘和分析至關(guān)重要,但傳統(tǒng)方法依賴藥化專家手動(dòng)整理大量專利,使用化學(xué)結(jié)構(gòu)繪制工具手動(dòng)繪制大量化學(xué)結(jié)構(gòu)并標(biāo)記活性數(shù)據(jù),進(jìn)行 SAR 分析,這個(gè)過(guò)程少則幾天,多則數(shù)周。
面對(duì)這一挑戰(zhàn),晶泰科技攜手粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院(簡(jiǎn)稱 “IDEA” 研究院),共同研發(fā)了專利數(shù)據(jù)挖掘平臺(tái)——PatSight,將這一過(guò)程時(shí)間縮短至 1 小時(shí)。(文末附試用鏈接)
PatSight,夢(mèng)照現(xiàn)實(shí)
藥物研發(fā)專家只需要將專利 PDF 文件上傳至 PatSight,1h 即可得到所有的專利化合物數(shù)據(jù),并且借助晶泰的 MolValley 平臺(tái)即可進(jìn)行 SAR 分析獲得結(jié)果。
1. 一小時(shí)全自動(dòng)識(shí)別結(jié)構(gòu)、名稱、活性
? 90% 專利實(shí)現(xiàn)1小時(shí)內(nèi)完成數(shù)據(jù)提取。
? 自動(dòng)識(shí)別專利的實(shí)例編號(hào)與結(jié)構(gòu)。
? 自動(dòng)識(shí)別匹配同一化合物的所有活性數(shù)據(jù)。

2. 操作便捷友好
? 一鍵跳轉(zhuǎn)至分子結(jié)構(gòu)和活性數(shù)據(jù)表格查看。
? 識(shí)別的結(jié)構(gòu)與專利中原結(jié)構(gòu)方向姿態(tài)一致,方便核驗(yàn)。

3. 識(shí)別準(zhǔn)確度高
? 對(duì)表格中實(shí)施例的結(jié)構(gòu)識(shí)別準(zhǔn)確率>95%。
? 對(duì)表格中活性數(shù)據(jù)的識(shí)別準(zhǔn)確率>97%。

MolValley進(jìn)行構(gòu)效關(guān)系分析
針對(duì) PatSight 提取的高質(zhì)量數(shù)據(jù),我們提供了云端的數(shù)據(jù)管理與分析平臺(tái)—— MolValley。MolValley 可以集中、系統(tǒng)的管理分子結(jié)構(gòu)和活性數(shù)據(jù),并提供構(gòu)效關(guān)系分析工具,助力用戶高效的解析小分子化合物結(jié)構(gòu)與生物活性間的奧秘。
案例分享
以一篇 FGFR2 相關(guān)的化合物專利(WO2020231990)為例,該專利包含 1500 個(gè)分子的結(jié)構(gòu)與活性數(shù)據(jù),涉及到的分子已進(jìn)入臨床階段。為了尋找更深入的構(gòu)效關(guān)系分析,我們將專利文件上傳至 PatSight,1 小時(shí)內(nèi)提取專利中所有實(shí)施例的化合物編號(hào)、結(jié)構(gòu)、Assay 信息、活性值。

通過(guò) MolValley 的 SAR 分析模塊,我們迅速識(shí)別出了三個(gè)主要的高頻片段,然后結(jié)合活性數(shù)據(jù)、靶點(diǎn)口袋等信息,迅速找到多個(gè)潛在的構(gòu)效關(guān)系模型,這對(duì)相關(guān)項(xiàng)目的后續(xù)開(kāi)發(fā)至關(guān)重要。

新品上線,邀您試用
點(diǎn)擊下方鏈接,點(diǎn)擊 “立即體驗(yàn)” 按鈕,完成注冊(cè)后即刻體驗(yàn)(目前每位用戶可免費(fèi)分析 3 篇/日)。
patent.xinsight-ai.com/home?ref=MC11X
