VerifyFileExtensionName.cs 6.2 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163
  1. // Admin.NET 项目的版权、商标、专利和其他相关权利均受相应法律法规的保护。使用本项目应遵守相关法律法规和许可证的要求。
  2. //
  3. // 本项目主要遵循 MIT 许可证和 Apache 许可证(版本 2.0)进行分发和使用。许可证位于源代码树根目录中的 LICENSE-MIT 和 LICENSE-APACHE 文件。
  4. //
  5. // 不得利用本项目从事危害国家安全、扰乱社会秩序、侵犯他人合法权益等法律法规禁止的活动!任何基于本项目二次开发而产生的一切法律纠纷和责任,我们不承担任何责任!
  6. namespace Admin.NET.Core;
  7. /// <summary>
  8. /// 验证文件类型
  9. /// </summary>
  10. public static class VerifyFileExtensionName
  11. {
  12. private static readonly IDictionary<string, string> DicsExt = new Dictionary<string, string>();
  13. private static readonly IDictionary<string, HashSet<int>> ExtDics = new Dictionary<string, HashSet<int>>();
  14. static VerifyFileExtensionName()
  15. {
  16. DicsExt.Add("FFD8FFE0", ".jpg");
  17. DicsExt.Add("FFD8FFE1", ".jpg");
  18. DicsExt.Add("89504E47", ".png");
  19. DicsExt.Add("47494638", ".gif");
  20. DicsExt.Add("49492A00", ".tif");
  21. DicsExt.Add("424D", ".bmp");
  22. // PS和CAD
  23. DicsExt.Add("38425053", ".psd");
  24. DicsExt.Add("41433130", ".dwg"); // CAD
  25. DicsExt.Add("252150532D41646F6265", ".ps");
  26. // 办公文档类
  27. DicsExt.Add("D0CF11E0", ".ppt,.doc,.xls"); // ppt、doc、xls
  28. DicsExt.Add("504B0304", ".pptx,.docx,.xlsx"); // pptx、docx、xlsx
  29. /* 注意由于文本文档录入内容过多,则读取文件头时较为多变-START */
  30. DicsExt.Add("0D0A0D0A", ".txt"); // txt
  31. DicsExt.Add("0D0A2D2D", ".txt"); // txt
  32. DicsExt.Add("0D0AB4B4", ".txt"); // txt
  33. DicsExt.Add("B4B4BDA8", ".txt"); // 文件头部为汉字
  34. DicsExt.Add("73646673", ".txt"); // txt,文件头部为英文字母
  35. DicsExt.Add("32323232", ".txt"); // txt,文件头部内容为数字
  36. DicsExt.Add("0D0A09B4", ".txt"); // txt,文件头部内容为数字
  37. DicsExt.Add("3132330D", ".txt"); // txt,文件头部内容为数字
  38. /* 注意由于文本文档录入内容过多,则读取文件头时较为多变-END */
  39. DicsExt.Add("7B5C727466", ".rtf"); // 日记本
  40. DicsExt.Add("255044462D312E", ".pdf");
  41. // 视频或音频类
  42. DicsExt.Add("3026B275", ".wma");
  43. DicsExt.Add("57415645", ".wav");
  44. DicsExt.Add("41564920", ".avi");
  45. DicsExt.Add("4D546864", ".mid");
  46. DicsExt.Add("2E524D46", ".rm");
  47. DicsExt.Add("000001BA", ".mpg");
  48. DicsExt.Add("000001B3", ".mpg");
  49. DicsExt.Add("6D6F6F76", ".mov");
  50. DicsExt.Add("3026B2758E66CF11", ".asf");
  51. // 压缩包
  52. DicsExt.Add("52617221", ".rar");
  53. DicsExt.Add("504B03040A000000", ".zip");
  54. DicsExt.Add("504B030414000000", ".zip");
  55. DicsExt.Add("1F8B08", ".gz");
  56. // 程序文件
  57. DicsExt.Add("3C3F786D6C", ".xml");
  58. DicsExt.Add("68746D6C3E", ".html");
  59. DicsExt.Add("04034b50", ".apk");
  60. //dics_ext.Add("7061636B", ".java");
  61. //dics_ext.Add("3C254020", ".jsp");
  62. //dics_ext.Add("4D5A9000", ".exe");
  63. DicsExt.Add("44656C69766572792D646174653A", ".eml"); // 邮件
  64. DicsExt.Add("5374616E64617264204A", ".mdb"); // Access数据库文件
  65. DicsExt.Add("46726F6D", ".mht");
  66. DicsExt.Add("4D494D45", ".mhtml");
  67. foreach (var dics in DicsExt)
  68. {
  69. foreach (var ext in dics.Value.Split(","))
  70. {
  71. if (!ExtDics.ContainsKey(ext))
  72. ExtDics.Add(ext, new HashSet<int> { dics.Key.Length / 2 });
  73. else
  74. ExtDics[ext].Add(dics.Key.Length / 2);
  75. }
  76. }
  77. }
  78. /// <summary>
  79. /// 文件格式和文件内容格式是否一致
  80. /// </summary>
  81. /// <param name="stream"></param>
  82. /// <param name="suffix"></param>
  83. /// <returns></returns>
  84. public static bool IsSameType(Stream stream, string suffix = ".jpg")
  85. {
  86. if (stream == null)
  87. return false;
  88. suffix = suffix.ToLower();
  89. if (!ExtDics.TryGetValue(suffix, out HashSet<int> dic)) return false;
  90. try
  91. {
  92. foreach (var len in dic)
  93. {
  94. byte[] b = new byte[len];
  95. stream.ReadExactly(b);
  96. // string fileType = System.Text.Encoding.UTF8.GetString(b);
  97. string fileKey = GetFileHeader(b);
  98. if (DicsExt.ContainsKey(fileKey))
  99. return true;
  100. }
  101. }
  102. catch (IOException)
  103. {
  104. }
  105. return false;
  106. }
  107. /**
  108. * 根据文件转换成的字节数组获取文件头信息
  109. * @param 文件路径
  110. * @return 文件头信息
  111. */
  112. private static string GetFileHeader(byte[] b)
  113. {
  114. string value = BytesToHexString(b);
  115. return value;
  116. }
  117. /**
  118. * 将要读取文件头信息的文件的byte数组转换成string类型表示
  119. * 下面这段代码就是用来对文件类型作验证的方法,
  120. * 将字节数组的前四位转换成16进制字符串,并且转换的时候,要先和0xFF做一次与运算。
  121. * 这是因为,整个文件流的字节数组中,有很多是负数,进行了与运算后,可以将前面的符号位都去掉,
  122. * 这样转换成的16进制字符串最多保留两位,如果是正数又小于10,那么转换后只有一位,
  123. * 需要在前面补0,这样做的目的是方便比较,取完前四位这个循环就可以终止了
  124. * @param src要读取文件头信息的文件的byte数组
  125. * @return 文件头信息
  126. */
  127. private static string BytesToHexString(byte[] src)
  128. {
  129. var builder = new StringBuilder();
  130. if (src == null || src.Length <= 0)
  131. return null;
  132. for (int i = 0; i < src.Length; i++)
  133. {
  134. // 以十六进制(基数 16)无符号整数形式返回一个整数参数的字符串表示形式,并转换为大写
  135. string hVal = Convert.ToString(src[i] & 0xFF, 16).ToUpper();
  136. if (hVal.Length < 2) builder.Append(0);
  137. builder.Append(hVal);
  138. }
  139. return builder.ToString();
  140. }
  141. }