
本教程详细介绍了如何使用PHP的PDO扩展将CSV文件数据导入MySQL数据库。文章从建立数据库连接、处理CSV文件、构建预处理语句等方面逐步讲解,并特别指出并纠正了在PDO预处理语句中常见的参数占位符语法错误。此外,教程还提供了增强代码健壮性的最佳实践,包括事务管理、错误处理以及针对大文件的优化策略,旨在帮助开发者高效、安全地完成数据导入任务。
1. 引言:使用PHP导入CSV数据到MySQL
在web开发中,将外部数据(如csv文件)导入到数据库是常见的需求。php结合mysql数据库以及pdo(php data objects)扩展,提供了一种安全高效的方式来完成这项任务。pdo的预处理语句机制不仅可以防止sql注入攻击,还能提高重复执行相同sql语句的效率。本教程将引导您完成整个导入过程,并着重讲解一个在预处理语句中常犯的语法错误及其解决方案。
2. 数据库连接设置
首先,我们需要建立与MySQL数据库的连接。使用PDO连接数据库是推荐的做法,因为它提供了统一的API接口和强大的错误处理机制。
<?php // 数据库连接参数 $dbHost = 'localhost'; // 数据库主机 $dbName = 'test'; // 数据库名 $dbChar = 'utf8mb4'; // 字符集,推荐utf8mb4以支持更广泛的字符 $dbUser = 'root'; // 数据库用户名 $dbPass = ''; // 数据库密码 try { // 创建PDO实例 $pdo = new PDO( "mysql:host=" . $dbHost . ";dbname=" . $dbName . ";charset=" . $dbChar, $dbUser, $dbPass, [ PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION, // 设置错误模式为抛出异常 PDO::ATTR_DEFAULT_FETCH_MODE => PDO::FETCH_ASSOC, // 设置默认的查询结果获取模式 PDO::ATTR_EMULATE_PREPARES => false, // 禁用模拟预处理,使用真正的预处理语句 ] ); // 开启事务,确保数据导入的原子性 $pdo->beginTransaction(); } catch (PDOException $ex) { // 捕获PDO连接或数据库操作异常 exit("数据库连接或操作失败: " . $ex->getMessage()); } catch (Exception $ex) { // 捕获其他通用异常 exit("发生未知错误: " . $ex->getMessage()); } // ... 后续CSV处理和数据导入逻辑 ?>
注意事项:
- PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION:这是非常重要的设置,它会使PDO在遇到错误时抛出PDOException,便于我们捕获和处理。
- PDO::ATTR_EMULATE_PREPARES => false:禁用模拟预处理可以确保PDO将SQL语句和参数分开发送到数据库服务器,从而利用数据库自身的预处理功能,提高安全性和性能。
- $pdo->beginTransaction();:在开始导入大量数据前开启事务是最佳实践。如果导入过程中出现任何错误,可以回滚所有已执行的插入操作,保持数据一致性。
3. 处理CSV文件上传与读取
在PHP中,处理CSV文件通常涉及到文件上传和文件内容的读取。
<?php // ... (数据库连接代码,如上所示) // 假设文件通过HTML表单上传,表单input的name为"upcsv" if (!isset($_FILES["upcsv"]) || $_FILES["upcsv"]["error"] !== UPLOAD_ERR_OK) { exit("文件上传失败或未选择文件。请确保文件已成功上传。"); } // 打开上传的CSV文件 $fh = fopen($_FILES["upcsv"]["tmp_name"], "r"); if ($fh === false) { exit("无法打开上传的CSV文件。"); } // ... 后续数据读取和插入逻辑 ?>
关键函数 fgetcsv():fgetcsv() 函数用于从文件指针中读取一行并解析为CSV字段。它非常灵活,可以指定分隔符、Enclosure(包围符)和Escape(转义符)。 在示例CSV数据 BGYR002217;FK-066 中,字段之间使用的是分号(;)作为分隔符,而不是默认的逗号(,)。因此,在使用 fgetcsv() 时,必须明确指定分隔符。
// ... (文件打开代码) // 准备SQL插入语句,并注意占位符的正确语法 $stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?, ?)"); $rowCount = 0; // 循环读取CSV文件的每一行 // 注意:fgetcsv的第三个参数是分隔符,这里指定为分号';' while (($row = fgetcsv($fh, 0, ';')) !== false) { // 简单的行数据校验:确保行有足够的元素 if (count($row) < 2) { error_log("跳过无效CSV行 (元素不足): " . implode(',', $row)); continue; // 跳过此行并处理下一行 } try { // 执行预处理语句,将CSV行数据绑定到占位符 $stmt->execute([$row[0], $row[1]]); $rowCount++; } catch (PDOException $ex) { // 记录插入失败的行和错误信息,可以选择继续或中断 error_log("插入数据失败,行内容: " . implode(',', $row) . " - 错误: " . $ex->getMessage()); // 如果希望在任何错误时都回滚并停止,可以取消注释以下两行 // $pdo->rollBack(); // exit("数据插入失败,已回滚所有操作: " . $ex->getMessage()); } } fclose($fh); // 关闭文件句柄 // ... 后续事务提交和完成信息
4. PDO预处理语句中的常见错误及纠正
原始代码中存在一个常见的语法错误:
立即学习“”;
$stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?;?)");
问题在于 VALUES (?;?)。在PDO的预处理语句中,问号 ? 是用于占位符的,它们之间不应该有其他字符(除非是命名占位符如 :name)。分号 ; 在SQL中通常表示语句的结束,在这里会破坏占位符的识别。
正确的语法应该是:
$stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?, ?)");
每个问号代表一个独立的参数占位符,它们之间用逗号 , 分隔,就像SQL的 VALUES 子句中列值之间用逗号分隔一样。
5. 完整的导入脚本示例
结合上述所有部分,一个健壮的CSV导入脚本示例如下:
PDO::ERRMODE_EXCEPTION, PDO::ATTR_DEFAULT_FETCH_MODE => PDO::FETCH_ASSOC, PDO::ATTR_EMULATE_PREPARES => false, ] ); $pdo->beginTransaction(); // 开启事务 // 2. 检查文件上传 if (!isset($_FILES["upcsv"]) || $_FILES["upcsv"]["error"] !== UPLOAD_ERR_OK) { throw new Exception("文件上传失败或未选择文件。错误码: " . ($_FILES["upcsv"]["error"] ?? 'N/A')); } // 3. 打开上传的CSV文件 $fh = fopen($_FILES["upcsv"]["tmp_name"], "r"); if ($fh === false) { throw new Exception("无法打开上传的CSV文件。"); } // 4. 准备SQL插入语句 (注意:VALUES (?, ?) 是正确的语法) // 假设数据库中有一个名为 'users' 的表,包含 'szam' 和 'forras_szam' 两列 $stmt = $pdo->prepare("INSERT INTO users (szam, forras_szam) VALUES (?, ?)"); $rowCount = 0; // 5. 循环读取CSV文件的每一行并插入数据 // 注意 fgetcsv 的第三个参数是分隔符,根据示例数据应为分号 ';' while (($row = fgetcsv($fh, 0, ';')) !== false) { // 简单的行数据校验:确保行有足够的元素 if (count($row) < 2) { error_log("跳过无效CSV行 (元素不足或格式不正确): " . implode(';', $row)); continue; } try { // 执行预处理语句,绑定CSV行数据 $stmt->execute([$row[0], $row[1]]); $rowCount++; } catch (PDOException $ex) { // 记录错误,可以选择回滚并退出,或继续处理下一行 error_log("插入数据失败,行内容: " . implode(';', $row) . " - 错误: " . $ex->getMessage()); // 如果希望在遇到第一个错误时立即停止并回滚: $pdo->rollBack(); exit("数据插入失败,已回滚所有操作: " . $ex->getMessage()); } } fclose($fh); // 关闭文件句柄 // 6. 提交事务 $pdo->commit(); echo "数据导入完成。共成功导入 " . $rowCount . " 条记录。"; } catch (PDOException $ex) { // 捕获PDO相关的异常,并尝试回滚事务 if (isset($pdo) && $pdo->inTransaction()) { $pdo->rollBack(); } exit("数据库操作失败: " . $ex->getMessage()); } catch (Exception $ex) { // 捕获其他通用异常 exit("操作失败: " . $ex->getMessage()); } ?>
为了让上述PHP脚本能够运行,您还需要一个简单的HTML表单来上传CSV文件:
<!DOCTYPE html> <html lang="zh-CN"> <head> <meta charset="UTF-8"> <title>CSV文件导入</title> </head> <body> <h1>上传CSV文件导入到MySQL</h1> <form action="import.php" method="post" enctype="multipart/form-data"> <label for="upcsv">选择CSV文件:</label> <input type="file" name="upcsv" id="upcsv" accept=".csv"> <br><br> <input type="submit" value="上传并导入" name="submit"> </form> </body> </html>
将上述HTML代码保存为 index.html,PHP代码保存为 import.php,确保它们在同一个目录下,并在您的Web服务器(如Apache或Nginx)上运行。
6. 进阶考虑与最佳实践
- 数据验证: 在实际应用中,您需要在 fgetcsv 读取数据后,对 $row 中的每个字段进行严格的验证(例如,数据类型、长度、格式等),以确保数据的完整性和正确性。
- 大型CSV文件: 对于非常大的CSV文件(例如,几十万甚至上百万行),PHP脚本可能会遇到内存限制或执行超时。在这种情况下,可以考虑以下替代方案:
- 分批处理: 逐行读取并插入,但每次提交一定数量的行(例如1000行)作为一个事务。
- LOAD DATA INFILE: 这是MySQL提供的专门用于从文件高效导入数据的SQL语句。它通常比通过PHP逐行插入快得多,并且可以处理非常大的文件。缺点是需要文件在服务器上可访问,并且需要相应的MySQL权限。
LOAD DATA INFILE '/path/to/your/file.csv' INTO TABLE users FIELDS TERMINATED BY ';' -- 指定字段分隔符 ENCLOSED BY '' -- 如果字段没有被引号包围,则留空 LINES TERMINATED BY 'n' -- 行结束符,Windows可能是'rn' (szam, forras_szam); -- 指定列名
登录后复制您可以通过PHP执行这条SQL语句,但需要确保CSV文件位于MySQL服务器可以访问的路径,并且MySQL用户拥有 FILE 权限。
- 用户界面反馈: 在实际应用中,您应该向用户提供更友好的进度反馈和错误提示,而不是简单的 exit() 或 echo “DONE.”。
- 日志记录: 将错误和警告信息记录到日志文件(如 error_log())中,而不是直接输出到浏览器,这对于调试和生产环境的监控至关重要。
7. 总结
通过本文,您应该已经掌握了如何使用PHP PDO将CSV数据导入MySQL数据库,并了解了PDO预处理语句中占位符的正确用法。记住,在进行数据导入时,不仅要关注代码的功能性,更要注重其健壮性、安全性和性能,特别是通过事务管理、错误处理和选择合适的导入策略来应对不同规模的数据。
以上就是PHP PDO实现CSV文件导入MySQL:常见错误与最佳实践的详细内容,更多请关注php中文网其它相关文章!
微信扫一扫打赏
支付宝扫一扫打赏
