基本信息
| 字段 | 内容 |
|---|
| 项目名称 | Kaggle Competition for LLM Identification of Smart Contract Vulnerabilities |
| 申请类型 | 活动类 |
| 申请赛道 | 公共人才培养、自由开源软件 |
| 申请金额 | 12,000 USDC |
| Github | 点击查看 |
| 社媒链接 | 点击查看 |
| 推荐人 | SunSec |
项目简介
Bastet 是一个开源的智能合约漏洞数据集与检测工作流框架。团队计划于 2026 年 Q2 在 Kaggle 平台举办一场公开竞赛,主题为使用 LLM 识别智能合约漏洞。这将是区块链安全生态中首次此类公开竞赛。
项目的核心动机是:随着 AI 技术普及,市面上出现了大量声称能够检测智能合约漏洞的 AI 工具,但这些工具多为闭源付费产品,其有效性无法被独立评估和复现。Bastet 通过提供开源数据集和标准化的检测工作流,让参赛者能够在统一基准上测试和比较不同方法的表现,使 LLM 在智能合约漏洞检测方面的能力和局限性变得透明且可验证。
团队隶属 DeFiHackLabs 运营团队,核心成员为白帽安全研究员。目前已获得以太坊基金会 ESP Grant 的部分支持(用于竞赛前期准备工作)。
Demo Day 补充: Alice 在演讲中强调,竞赛规则设计为:提供漏洞的大标签与小标签及一句话描述,参赛者可以使用任何方法(包括自行训练的 LLM),最终提交漏洞识别结果进行评分。参赛者如使用自训练模型,需提交给团队以便复现结果。
申请金额
12,000 USDC
解决的公共问题
-
AI 安全工具的有效性不可验证: 当前市面上众多 AI 安全审计工具声称能检测漏洞,但由于闭源且无统一基准,安全研究员和项目方无法评估哪个工具更适合自己的需求。
-
安全人才参与门槛高: AI 人才和安全研究员难以基于现有闭源工具的结果进行进一步实验和贡献,限制了生态的安全知识积累。
-
缺乏公开的漏洞检测基准数据集: 生态中没有一个由社区驱动的、可持续维护的公开漏洞数据集来支撑研究和工具评估。
对华语区的贡献
-
跨亚洲人才网络拓展: 团队正在积极拓展亚洲范围内的宣传网络,已确认与新加坡、日本、台湾的大学建立宣传合作,并正在拓展香港高校连接。
-
连接华语安全社区: 通过与 DeFiHackLabs 等社区的紧密合作,将竞赛信息触达中国大陆的高校和技术社区,吸引更多华语区 AI 与安全人才参与。
-
促进区块链与 AI 跨学科合作: 希望通过竞赛汇聚亚洲的区块链和 AI 人才,促进跨学科协作与知识共享。
开源与公共产出
- 数据集完全开源且由社区驱动:点击查看
- 提供优化的漏洞检测工作流(n8n workflow):点击查看
- 竞赛结果将形成完整的公开研究摘要,与 GCC 合作推广具有长期公共价值的研究成果
- 曾在 DeFiHackLabs 技术分享中展示 AI 漏洞检测经验:点击查看
团队信息
团队详细信息:点击查看
核心成员来自 DeFiHackLabs 运营团队与 OneSavieLabs 开源安全项目,拥有白帽安全研究与 AI 漏洞检测方面的深厚经验。
GCC 权益
- 竞赛中的持续露出:在竞赛页面、宣传物料、赛后成果报告中公开致谢 GCC
- Cohort 宣传支持:应 GCC 要求,支持 GCC Cohort 的宣传
- 公共研究成果共享:竞赛结束后发布完整的研究发现与观察摘要,与 GCC 合作推广
- 未来盈利回馈:项目无商业化计划,所有产出为公共物品
Milestone 与资金解锁
| 阶段 | 内容 | 比例 | 金额 | 预计完成 |
|---|
| M0 | 基本 GCC 权益确认:在竞赛宣传页面与物料中注明 GCC 支持,并应 GCC 要求支持 Cohort 宣传 | 20% | $2,400 | 资金到账后 2 周 |
| M1 | Kaggle 竞赛顺利运营:确保竞赛平稳运行,实时处理技术问题,收集参赛者反馈以改进后续活动。所有竞赛活动须注明 GCC 资助并应 GCC 要求支持 Cohort 宣传 | 20% | $2,400 | 2026-04-30 |
| M2 | 赛后验证与成果发布:验证和复现提交的解决方案,收集反馈,整理研究洞察并发布公开报告,确保数据集完整性。赛后报告须注明 GCC 资助 | 60% | $7,200 | 2026-07-07 |
注: 原申请立即解锁比例为 50%,调低至 20%,多出部分加至 M2(原 30%→60%)。M1 保持原 20% 不变。里程碑资金使用计划详见:点击查看
Demo Day Q&A 摘要
以下内容整理自 2026 年 2 月 12 日 GCC Cohort 2 Demo Day 录像(约 00:29:48 – 00:40:55)及聊天记录。
Q:数据集的来源是什么?
A:数据集基于 Bastet 项目的公开漏洞数据集,由社区驱动维护。
Q:比赛中必须提交 LLM 来识别吗?还是任意一个识别算法就行?
A:比赛规则是提供漏洞的大标签、小标签和一句话描述,参赛者可以使用任何方法。最终评分基于漏洞识别的准确度。如果使用自训练模型,需提交给团队以便复现结果。
Q:在宣传上需要额外做什么?
A:我们在宣传渠道上比较困难,这也是来找 GCC 合作的原因之一。以太坊基金会也会帮助做一些宣传。Herstory 社区表示可以支持,社区里有不少白帽。
注:以上问答根据会议录音转写整理,经语义整合,保留核心内容。
GCC Cohort 2 Demo Day(2026.2.12)完整录像:
点击查看
密码: t%1A$KQ5
00:29:48 – 00:40:55
投票规则
- 共有 9 名投委,投票率超过 50% 方可生效;赞成票数 ≥ 总票数的 2/3 视为通过。
- 投委可选择是否调整最终资助金额,调整选项为:+10%、+5%、0、−5%、−10%;所有投委的调整比例直接加总,作为对申请金额的最终增减幅度。