Projects
本组现在的主要研究目标是NLP在相关领域的赋能。主要的研究内容包括:NLP中语言资源建设,包括语料库的标注,校准,词法句法等相关的基础性研究(曲老师),NLP相关基础算法相关应用(周老师,最近周老师在做一些与智慧教育相关的工作),NLP相关应用(顾)。假如你对词法句法(离合词,未登录词,复合词等的发现,语料库标注)以及NLP基础性研究比较感兴趣也可以联系他们两位老师。 我博士期间以及到2015年一直是做数据库相关研究(Power aware Database System,IR)等,并且你从DBLP上也可以看到我的一些paper。从2016年转型专注NLP,2016ACL的paper就是当时结合数据库与NLP技术的一个交叉研究(交叉这个词最近比较火热)。2019开始利用NLP相关技术来加速材料筛选,跟东南大学王金兰老师,以及本校李亚飞老师合作。所以我很多思维以及方法有DB的烙印,这些你也可以通过其他同学来了解。这个研究方向也获得了国家自然基金重点项目的支持。
Featured

We currently work on AI for Science, with a particular focus on AI-powered drug discovery and generative AI for biology and chemistry. We also develop next-generation AI for antibody design and protein therapeutics discovery.

We try to explore some NLP application to better understand and generate discerte symbols including text, small molecules and proteins.
More

We focus on big data analytics, especially for the protein, biomedical image, text and so on.

We develop machine learning models for medial image, social network and so on.

Exploration on effectiveness and efficiency of similar sentence matching in the incremental database.