二进制相似代码检测及其在补丁代码分析中的应用

二进制代码相似性分析是软件安全最基础且重要的技术方法之一,其在现实有诸多有价值的应用,包括已知漏洞检测、恶意软件分析、补丁代码分析等,其核心挑战在于语义保持的代码变换,比如编译器优化、代码混淆等,使得即便是相同源代码编译得到的二进制代码在语法和代码结构层面上差别巨大。尽管多年以来该研究课题得到了学术界和工业界的共同关注,且投入了大量努力,相关方法的现实表现距离预期依然有明显的距离,其主要原因在于分析精度和效率的天然矛盾,即越加精准的分析方法就越耗时,而越加高效的方法分析精度就越加不可靠。因此,本研究从二进制代码相似性分析技术出发,研究更加精准并且具有实用价值的分析方法,并测试其在补丁代码分析、恶意软件分析等场景中的效果。