MyBatis-Plus批量插入的实现原理

前言：批量插入的性能挑战

在实际开发中，如考试系统、订单处理、日志存储等场景，经常需要批量插入大量数据。例如，在一个在线考试系统中，创建一份试卷需要插入多张表的数据：

在保存试卷时，需要关联保存试卷、题目以及题目选项，此时对于保存的性能就有较高的要求了。

在 MyBatis-Plus 中，saveBatch 方法是用于批量保存数据的方法。它能够在单次操作中将多条数据同时插入数据库，从而提高插入效率，减少数据库连接次数，提升性能。

entityList：要插入的实体类集合。可以是任何实现了 Collection 接口的集合类型，如 List、Set 等。
batchSize（可选）：指定每次批量插入的大小。默认情况下，MyBatis-Plus 会一次性插入所有数据。如果设置了 batchSize，则会按指定大小分批插入，避免一次性插入大量数据时出现性能问题或内存溢出。

不支持多条 SQL 合并：在默认情况下，即便使用 saveBatch，也有可能是逐条发送 SQL 语句。这会导致生成的 SQL 更冗长、性能较低，尤其是在数据量较大时，执行效率会明显下降，无法充分利用数据库批量插入的特性。
性能提升有限：默认实现并未针对批量插入进行特殊优化。例如，它可能无法充分利用 JDBC 的批量操作特性，导致性能不如手动实现的批量插入逻辑。对于大批量插入，性能可能不理想。
主键生成方式局限性：如果实体类中主键是由数据库自动生成（如自增主键），默认实现会多次与数据库交互获取主键值。这会增加额外的数据库开销。尤其是当数据量较大时，主键生成的额外查询操作会显著降低性能。
外键关系处理复杂：需要在插入数据后获取主键 ID，这导致无法在批量插入时建立关联关系，使得外键关系处理变得复杂。
缺乏灵活性：默认实现只能进行简单的插入操作，不能处理条件性插入（如：插入前判断是否已存在相同记录）或插入冲突处理（如主键冲突时自动更新数据）。对需要动态逻辑的场景不适用。

JDBC 批处理机制是一种优化数据库操作性能的技术，允许将多条 SQL 语句作为一个批次发送到数据库服务器执行，从而减少客户端与数据库之间的交互次数，显著提高性能。通常用于批量插入、批量更新和批量删除等场景。具体的流程如下：

启用批处理重写：启用批处理重写功能后，驱动能够将多条同类型的 SQL 语句进行合并，进而发送给数据库执行。
减少网络交互：一次发送多条 SQL，可有效降低网络延迟，减少网络交互次数。
提高执行效率：当所有数据都通过一条 SQL 插入时，MySQL 只需要解析一次 SQL，降低了解析和执行的开销。
减少内存消耗：虽然批量操作时将数据合并到一条 SQL 中，理论上会增加内存使用（因为需要构建更大的 SQL 字符串），但相比多次单条插入的网络延迟和处理开销，整体的资源消耗和执行效率是更优的。

未开启参数时的批处理 SQL：

开启参数后的批处理 SQL：

在插入题目和选项时，选项需要引用对应题目的主键 ID。如果等待题目插入后再获取 ID，会导致无法进行批量操作，影响性能。所以，预先生成ID就成了我们解决问题的关键。

使用雪花算法（分布式 ID 生成器）：

在构建题目和选项数据时，预先生成 ID，并在选项中引用对应的题目 ID：

直接在多线程中调用 saveBatch 方法，可能导致以下问题：

程安全性：在 MyBatis 中，SqlSession 在默认情况下并非线程安全的。若在多线程环境下共享同一个 SqlSession，极有可能导致数据错误或引发异常。
事务管理：对于多线程操作而言，需要独立的事务管理机制，以此来确保数据的一致性。
资源竞争：过多的并发线程有可能致使数据库连接池被耗尽，进而降低性能。