C#获取文件MIME类型 C#如何根据文件扩展名或内容得到MIME Type

1次阅读

推荐使用 mimetypes.core 等第三方库实现跨平台 mime 类型推断，它支持扩展名查表与文件头 magic bytes 双重检测，兼顾准确性与性能，避免 windows api 依赖和内置 mediatypenames 的覆盖不足问题。

用 `System.Net.Mime.MediaTypeNames` 查扩展名映射（简单但不准确）

.NET 内置的 MediaTypeNames 类只提供少量常见扩展名到 MIME 的静态映射，比如 MediaTypeNames.Image.Jpeg 对应 "image/jpeg"，但它不支持动态查扩展名，也没有内置函数把 ".png" 转成 "image/png"。

实际项目中直接靠它做判断会漏掉大量格式（如 ".webp"、".avif"、".md"），甚至返回空或错误值。它更适合写死已知类型，而非通用检测。

如果只是快速原型且只处理 .jpg / .pdf / .txt 这类经典后缀，可手动建个字典：

var extToMime = new Dictionary<String, string> {     [".jpg"] = "image/jpeg",     [".jpeg"] = "image/jpeg",     [".png"] = "image/png",     [".pdf"] = "application/pdf",     [".txt"] = "text/plain" }; string mime = extToMime.GetValueOrDefault(Path.GetExtension(filePath).ToLowerInvariant(), "application/octet-stream");

用 Windows API `FindMimeFromData`（仅 Windows，需 P/Invoke）

这是 Windows 系统级的 MIME 推断函数，会读取文件头（前 256 字节）分析内容，比纯扩展名可靠得多，比如能区分 .bin 和 .exe，也能识别无扩展名或扩展名被篡改的文件。

但注意：FindMimeFromData 已标记为 deprecated，且在 .NET Core/.NET 5+ 中默认不可用，需手动 P/Invoke，并依赖 urlmon.dll —— 这意味着它不能跨平台，linux/macos 下直接抛 DllNotFoundException。

使用要点：

传入的 buffer 长度建议 ≥ 256 字节；小于 256 可能误判（如某些 xml 文件需看到 <?xml ）
第三个参数 pszUrl 可传 NULL，但若传了带扩展名的 URL，系统会优先按扩展名 fallback，削弱内容检测效果
返回的 MIME 字符串末尾可能带空格或换行，记得 .Trim()

用第三方库 `MailKit` 或 `MimeTypes`（推荐跨平台方案）

MimeTypes（NuGet 包 Humanizr.MimeTypes 或更轻量的 MimeTypes.Core）是目前最省心的选择：纯 C# 实现、无平台依赖、支持 1000+ 扩展名 + 常见 magic bytes 检测。

示例（以 MimeTypes.Core 为例）：

var mime = MimeTypes.GetMimeType("document.pdf"); // → "application/pdf" mime = MimeTypes.GetMimeType("unknown", File.ReadAllBytes(filePath)); // 读内容推断

它内部做了两层 fallback：先查扩展名，再读文件头比对签名（magic number）。比如 .jpg 文件即使被改成 .dat，只要开头是 FF D8 FF，仍能返回 "image/jpeg"。

注意点：

不要对大文件全量读取再传入 —— 它的 GetMimeType(string filename) 重载会自动打开文件并只读前几百字节
若自己传 byte[]，务必限制长度（通常 ≤ 1024 字节足够），否则影响性能
某些边缘格式（如新版 .heic）可能未覆盖，可手动注册补充

自研 magic bytes 检测（适合定制化或规避依赖）

如果项目禁止引入第三方包，又需要比扩展名更准的结果，可以手写一个轻量 content-based 检测器。核心是维护一个 (byte[], offset, mime) 列表，按匹配优先级排序。

例如判断 PNG：

if (bytes.Length >= 8 &&     bytes[0] == 0x89 && bytes[1] == 0x50 &&     bytes[2] == 0x4E && bytes[3] == 0x47 &&     bytes[4] == 0x0D && bytes[5] == 0x0A &&     bytes[6] == 0x1A && bytes[7] == 0x0A) {     return "image/png"; }

常见陷阱：

UTF-8 bom（EF BB BF）和 ASCII 文本容易混淆，text/plain 应放在最后 fallback，否则会盖掉 text/html 或 application/json
ZIP 系列（.jar、.docx、.xlsx）共享同一 magic（50 4B 03 04），得靠扩展名二次判断
部分格式头部有可变字段（如 PDF 的 %PDF- 版本号位置不固定），要用 IndexOf 而非固定 offset

真正可靠的 MIME 判断永远需要权衡：扩展名快但假，内容检测准但慢且有盲区。生产环境建议用 MimeTypes.Core 这类成熟小库，它把 magic bytes 覆盖率、fallback 逻辑和边界 case 都收口了，比自己拼凑更稳。

发表于：php框架

近一天内

复制链接

mysql执行SQL时如何判断是否走索引_mysql执行流程分析

React + Supabase 数据获取失败的常见原因及修复方案

css 想让图片在页面加载时从左到右滑动怎么办_使用 transform translateX keyframes 设置动画

如何在 JavaScript 中动态替换字符串中的所有匹配项

实现网页元素长按/触摸按下时触发持续操作的 JavaScript 事件监听方案

C#获取文件MIME类型 C#如何根据文件扩展名或内容得到MIME Type

用 `System.Net.Mime.MediaTypeNames` 查扩展名映射（简单但不准确）

用 Windows API `FindMimeFromData`（仅 Windows，需 P/Invoke）

用第三方库 `MailKit` 或 `MimeTypes`（推荐跨平台方案）

自研 magic bytes 检测（适合定制化或规避依赖）

c++的复制省略(Copy Elision)是什么，编译器如何优化？ (详解RVO)

如何在 Pandas 中安全跳过空 DataFrame 的链式操作

Go 模板中结构体字段必须首字母大写才能被正确访问

Composer why 和 why-not 命令如何帮助调试？ (依赖关系分析)

PHP版本信息如何隐藏_降低被漏洞扫描发现风险的配置技巧【技巧】

css动画如何实现元素的旋转效果_通过transform旋转和@keyframes实现

CSS伪元素实现简单的日历图标_纯CSS构建布局与日期

C++怎么使用Eigen库_C++矩阵运算教程【科学】

SQL max_parallel_workers_per_gather 的并行 worker 数量与 CPU 核数匹配经验

CSS伪元素::placeholder美化_定制表单输入框的占位文字

C#获取文件MIME类型 C#如何根据文件扩展名或内容得到MIME Type

用 System.Net.Mime.MediaTypeNames 查扩展名映射（简单但不准确）

用 Windows API FindMimeFromData（仅 Windows，需 P/Invoke）

用第三方库 MailKit 或 MimeTypes（推荐跨平台方案）

自研 magic bytes 检测（适合定制化或规避依赖）

用 `System.Net.Mime.MediaTypeNames` 查扩展名映射（简单但不准确）

用 Windows API `FindMimeFromData`（仅 Windows，需 P/Invoke）

用第三方库 `MailKit` 或 `MimeTypes`（推荐跨平台方案）