使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程

34次阅读

使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程

本教程详细介绍了如何在PHP中实现图片相似度比对,以解决传统MD5哈希无法识别相似图片的问题。通过引入第三方感知哈希库,我们能够计算上传图片与目标目录下所有图片的相似度,并根据设定的阈值筛选并展示相似图片。教程涵盖了从HTML表单到PHP处理逻辑、代码示例、关键注意事项及性能优化建议,帮助开发者构建高效的图片相似度识别功能。

挑战与传统方法的局限性

在web开发中,我们经常遇到需要识别图片相似性的场景,例如防止重复上传、内容推荐或查找视觉相似的商品。传统的图片比对方法,如计算图片的md5哈希值,只能识别完全相同的图片。即使图片经过轻微的压缩、裁剪或尺寸调整,其md5哈希值也会发生巨大变化,导致无法识别其视觉上的相似性。因此,我们需要一种更智能的方法来衡量图片之间的“感知”相似度。

核心原理:感知哈希(Perceptual Hashing)

感知哈希(Perceptual Hashing,简称pHash)是一种通过算法提取图片视觉特征并生成一个“指纹”(哈希值)的技术。与MD5等加密哈希不同,感知哈希的特点是:即使图片经过轻微修改(如缩放、亮度调整、裁剪等),其生成的哈希值也只会发生微小变化。通过比较两个感知哈希值之间的差异(通常是汉明距离),我们可以量化两张图片视觉上的相似程度。差异越小,图片越相似。

引入图片比对库

为了在PHP中实现感知哈希比对,我们可以利用现有的第三方库。本教程将以nvthaovn/CompareImage这个GitHub仓库中提供的compareImages.php类为例。这个类封装了感知哈希的计算逻辑,简化了图片比对过程。

准备工作:

  1. 下载compareImages.php文件,并将其放置在您的项目目录中,确保PHP脚本可以正确引用。
  2. 确保您的PHP环境已安装并启用了GD库(或其他图像处理扩展,如ImageMagick),因为compareImages.php通常会依赖这些库来处理图片。

实现步骤

下面我们将分步介绍如何构建一个功能,允许用户上传图片,然后将其与服务器上指定目录中的所有图片进行比对,并显示相似的图片。

立即学习PHP免费学习笔记(深入)”;

1. HTML表单准备

首先,创建一个简单的HTML表单,用于用户上传图片。

<!DOCTYPE html> <html> <head>     <title>图片相似度比对</title> </head> <body>     <form method="post" enctype="multipart/form-data">         <label for="imageFile">选择图片:</label>         <input type="file" name="file" id="imageFile"><br>         <input type="submit" name="submit" value="提交比对">     </form> </body> </html>

2. PHP处理逻辑

接下来是PHP脚本,它将处理文件上传、实例化比对类、遍历目录并执行比对。

使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程

可灵AI

可灵ai:新一代AI创意生产力平台

使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程11061

查看详情 使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程

<?php // 引入图片比对类文件 include('compareImages.php');  // 定义图片存储目录和待比对图片目录 $uploadDir = 'upload/'; // 用户上传图片存储目录 $compareDir = 'img/';   // 待比对图片所在目录  // 确保目录存在且可写 if (!is_dir($uploadDir)) {     mkdir($uploadDir, 0777, true); } if (!is_dir($compareDir)) {     mkdir($compareDir, 0777, true);     // 提示:此处应放置一些图片到 img/ 目录以供比对测试 }  // 处理表单提交 if (isset($_POST['submit'])) {     // 检查文件上传是否成功     if (isset($_FILES['file']) && $_FILES['file']['error'] === UPLOAD_ERR_OK) {         $filepath = pathinfo($_FILES['file']['name']);         $extension = strtolower($filepath['extension']); // 统一小写扩展名          // 生成唯一文件名,防止覆盖         $iname = date('YmdHis') . '_' . uniqid() . '.' . $extension;         $uploadedImagePath = $uploadDir . $iname;          // 移动上传文件到指定目录         if (move_uploaded_file($_FILES['file']['tmp_name'], $uploadedImagePath)) {             echo "<h3>上传图片:</h3>";             echo "<img height='150px' src='" . $uploadedImagePath . "'/><br>";             echo "<h3>相似图片:</h3>";              try {                 // 实例化图片比对器,传入上传图片的路径                 $compareMachine = new compareImages($uploadedImagePath);                  // 获取待比对目录下的所有图片文件                 // 仅获取常见图片格式,可根据需要扩展                 $imagesToCompare = glob($compareDir . "*.{jpg,jpeg,png,gif}", GLOB_BRACE);                  $similarImagesFound = false;                  foreach ($imagesToCompare as $image) {                     // 排除上传文件自身(如果上传目录和比对目录相同)                     if (realpath($image) === realpath($uploadedImagePath)) {                         continue;                     }                      // 执行比对,获取差异值                     $diff = $compareMachine->compareWith($image);                      // 设置相似度阈值。diff值越小表示越相似。                     // 21 是一个经验值,可根据实际需求调整。                     if ($diff < 21) {                         echo "<img height='70px' width='70px' src='" . $image . "' style='margin: 5px;'/>";                         $similarImagesFound = true;                     }                 }                  if (!$similarImagesFound) {                     echo "<p>未找到相似图片。</p>";                 }              } catch (Exception $e) {                 echo "<p style='color: red;'>比对过程中发生错误:" . $e->getMessage() . "</p>";             }          } else {             echo "<p style='color: red;'>文件上传失败,请检查目录权限。</p>";         }     } else {         echo "<p style='color: red;'>请选择一个图片文件进行上传。</p>";         // 详细错误信息         // echo "<p style='color: red;'>错误代码: " . $_FILES['file']['error'] . "</p>";     } } ?>

注意事项与优化

  1. 相似度阈值 ($diff < 21):

    • compareImages库返回的$diff值代表两个感知哈希之间的差异。值越小,图片越相似。
    • 21是一个经验值,表示图片具有较高的相似度。您可以根据实际应用场景和对相似度的容忍程度来调整这个阈值。例如,如果需要更严格的相似度,可以降低阈值(如10);如果允许更大差异,可以提高阈值(如30)。
  2. 性能考虑:

    • 大量图片比对: 如果img/目录包含成千上万张图片,每次请求都对所有图片进行哈希计算和比对会非常耗时。
    • 优化策略:
      • 预计算哈希: 在图片上传到img/目录时,提前计算其感知哈希值并存储到数据库或文件中。比对时,只需加载这些预计算的哈希值进行比较,而不是每次都重新处理图片文件。
      • 索引: 对于非常大的数据集,可以考虑使用专门的图像搜索引擎或库(如Elasticsearch结合插件)来索引和查询图像特征。
      • 缓存: 对比对结果进行缓存,避免重复计算。
  3. 错误处理与安全性:

    • 文件上传: 始终对上传的文件进行严格的验证,包括文件类型(MIME类型和扩展名)、文件大小、文件内容(防止上传恶意脚本)。
    • 目录权限: 确保upload/和img/目录具有正确的写入权限,否则文件上传和处理会失败。
    • 库文件缺失: 确保compareImages.php文件存在且可访问。
    • 异常处理: 使用try-catch块捕获compareImages类可能抛出的异常,如图片文件损坏或GD库问题。
  4. 图片格式支持:

    • compareImages.php库通常依赖PHP的GD库或ImageMagick扩展来处理图片。确保您的服务器环境支持所需的图片格式(JPEG, PNG, GIF等)。
    • glob()函数中的*.{jpg,jpeg,png,gif}可以根据需要添加或移除支持的图片格式。

总结

通过引入感知哈希(Perceptual Hashing)技术和相应的PHP库,我们能够有效地解决传统MD5哈希在图片相似度识别方面的局限性。本教程提供了一个基于compareImages.php库的实用方案,实现了用户上传图片与目录中现有图片的相似度比对与展示。在实际应用中,务必关注性能优化、安全性以及灵活调整相似度阈值,以构建健壮且高效的图片相似度识别系统。

以上就是使用PHP实现图片相似度比对:基于感知哈希的目录图像查找与展示教程的详细内容,更多请关注php html git github mac 搜索引擎 html表单 表单提交 php脚本 red php html 封装 try catch GD库 github 算法 elasticsearch 数据库 搜索引擎 性能优化

php html git github mac 搜索引擎 html表单 表单提交 php脚本 red php html 封装 try catch GD库 github 算法 elasticsearch 数据库 搜索引擎 性能优化

text=ZqhQzanResources