• • 下一篇
张立孝1,马垚2,杨玉丽2,于丹2,陈永乐2
摘要: 物联网设备厂商在固件开发中通常会大量复用基于开源代码编译而成的开源组件,每个固件由上百个组件构成。如果这些组件未能及时更新,未打上安全补丁的开源组件可能会携带漏洞集成到固件中,进而给物联网设备埋下安全隐患。因此,识别物联网固件中的二进制组件对于确保物联网设备的安全性至关重要。针对现有方法难以大规模识别二进制组件的问题,提出一种基于命名实体识别的大规模物联网二进制组件识别方法。该方法首先通过固件解压提取内部二进制组件,然后通过可读字符串提取和组件执行两个方式获取组件的语义信息,最后,利用RoBERTa-BiLSTM-CRF命名实体识别模型识别组件名和版本号。在12个流行的物联网生产商发布的6575个固件上进行实验,该方法获得了87.67%的F1值,可成功识别163个二进制组件。实验结果表明:该方法有效扩大了物联网固件中二进制组件的识别范围,有助于从软件供应链角度保障固件安全。
中图分类号: