python解析mht文件_php解析mht文件转换成html的实例
/**
* 针对Mht格式的文件进行解析
* 使用例子:
*
* function mhtmlParseBody($filename) {
if (file_exists ( $filename )) {
if (is_dir ( $filename )) return false;
$filename = strtolower ( $filename );
if (strpos ( $filename, '.mht', 1 ) == FALSE) return false;
$o_mhtml = new mhtml ();
$o_mhtml->set_file ( $filename );
$o_mhtml->extract ();
return $o_mhtml->get_part_to_file(0);
}
return null;
}
function mhtmlParseAll($filename) {
if (file_exists ( $filename )) {
if (is_dir ( $filename )) return false;
$filename = strtolower ( $filename );
if (strpos ( $filename, '.mht', 1 ) == FALSE) return false;
$o_mhtml = new mhtml ();
$o_mhtml->set_file ( $filename );
$o_mhtml->extract ();
return $o_mhtml->get_all_part_file();
}
return null;
}
*/
class mhtparse {
var $file = '';
var $boundary = '';
var $filedata = '';
var $countparts = 1;
var $log = '';
function extract() {
$this->read_filedata ();
$this->file_parts ();
return 1;
}
function set_file($p) {
$this->file = $p;
}
function get_log() {
return $this->log;
}
function file_parts() {
$lines = explode ( "\n", substr ( $this->filedata, 0, 8192 ) );
foreach ( $lines as $line ) {
$line = trim ( $line );
if (strpos ( $line, '=' ) !== FALSE) {
if (strpos ( $line, 'boundary', 0 ) !== FALSE) {
$range = $this->getrange ( $line, '"', '"', 0 );
$this->boundary = "--" . $range ['range'];
$this->filedata = str_replace ( $line, '', $this->filedata );
break;
}
}
}
if ($this->boundary != '') {
$this->filedata = explode ( $this->boundary, $this->filedata );
unset ( $this->filedata [0] );
$this->filedata = array_values ( $this->filedata );
$this->countparts = count ( $this->filedata );
} else {
$tmp = $this->filedata;
$this->filedata = array (
$tmp
);
}
}
function get_all_part_file() {
return $this->filedata;
}
function get_part_to_file($i) {
$line_data_start = 0;
$encoding = '';
$part_lines = explode ( "\n", ltrim ( $this->filedata [$i] ) );
foreach ( $part_lines as $line_id => $line ) {
$line = trim ( $line );
if ($line == '') {
if (trim ( $part_lines [0] ) == '--')
return 1;
$line_data_start = $line_id;
break;
}
if (strpos ( $line, ':' ) !== FALSE) {
$pos = strpos ( $line, ':' );
$k = strtolower ( trim ( substr ( $line, 0, $pos ) ) );
$v = trim ( substr ( $line, $pos + 1, strlen ( $line ) ) );
if ($k == 'content-transfer-encoding') {
$encoding = $v;
}
if ($k == 'content-location') {
$location = $v;
}
if ($k == 'content-type') {
$contenttype = $v;
}
}
}
foreach ( $part_lines as $line_id => $line ) {
if ($line_id <= $line_data_start)
$part_lines [$line_id] = '';
}
$part_lines = implode ( '', $part_lines );
if ($encoding == 'base64')
$part_lines = base64_decode ( $part_lines );
elseif ($encoding == 'quoted-printable')
$part_lines = imap_qprint ( $part_lines );
return $part_lines;
}
function read_filedata() {
$handle = fopen ( $this->file, 'r' );
$this->filedata = fread ( $handle, filesize ( $this->file ) );
fclose ( $handle );
}
function getrange(&$subject, $Beginmark_str = '{', $Endmark_str = '}', $Start_pos = 0) {
/*
* $str="sssss { x { xx } {xx{xx } x} x} sssss"; $range=string::getRange($str,'{','}',0); echo $range['range']; //tulem: " x { xx } {xx{xx } x} x" echo $range['behin']; //tulem: 6 echo $range['end']; //tulem: 30 (' ') -- l5pumärgist järgnev out: array('range'=>$Range,'begin'=>$Begin_firstOccurence_pos,'end'=>$End_sequel_pos) | false v1.1 2004-2006,Uku-Kaarel J5esaar,ukjoesaar@hot.ee,http://www.hot.ee/ukjoesaar,+3725110693
*/
if (empty ( $Beginmark_str ))
$Beginmark_str = '{';
$Beginmark_str_len = strlen ( $Beginmark_str );
if (empty ( $Endmark_str ))
$Endmark_str = '}';
$Endmark_str_len = strlen ( $Endmark_str );
/* $Start_pos_cache = 0; */
do {
/* !algus */
if (! is_int ( $Begin_firstOccurence_pos ))
$Start_pos_cache = $Start_pos;
/* ?algus-test */
$Start_pos_cache = @strpos ( $subject, $Beginmark_str, $Start_pos_cache );
/* this is possible start for range */
if (is_int ( $Start_pos_cache )) {
/* skip */
$Start_pos_cache = ($Start_pos_cache + $Beginmark_str_len);
/* test possible range start pos */
if (is_int ( $Begin_firstOccurence_pos )) {
if ($Start_pos_cache < $range_end_pos)
$rangeClean = 0;
elseif ($Start_pos_cache > $range_end_pos)
$rangeClean = 1;
}
/* here it is */
if (! is_int ( $Begin_firstOccurence_pos ))
$Begin_firstOccurence_pos = $Start_pos_cache;
} /* VIGA NR 0 ALGUST EI OLE */
if (! is_int ( $Start_pos_cache )) {
/* !algus */
/* VIGA NR 1 ALGUSMARKI EI LEITUD : VIIMANE VOIMALIK ALGUS */
if (is_int ( $Begin_firstOccurence_pos ) and ($Start_pos_cache < $range_end_pos))
$rangeClean = 1;
else
return false;
}
if (is_int ( $Begin_firstOccurence_pos ) and ($rangeClean != 1)) {
if (! is_int ( $End_pos_cache ))
$End_sequel_pos = $Begin_firstOccurence_pos;
$End_pos_cache = strpos ( $subject, $Endmark_str, $End_sequel_pos );
/* ok */
if (is_int ( $End_pos_cache ) and ($rangeClean != 1)) {
$range_current_lenght = ($End_pos_cache - $Begin_firstOccurence_pos);
$End_sequel_pos = ($End_pos_cache + $Endmark_str_len);
$range_end_pos = $End_pos_cache;
}
/* VIGA NR 2 LOPPU EI LEITUD */
if (! is_int ( $End_pos_cache ))
if ($End_pos_cache == false)
return false;
}
} while ( $rangeClean < 1 );
if (is_int ( $Begin_firstOccurence_pos ) and is_int ( $range_current_lenght ))
$Range = substr ( $subject, $Begin_firstOccurence_pos, $range_current_lenght );
else
return false;
return array (
'range' => $Range,
'begin' => $Begin_firstOccurence_pos,
'end' => $End_sequel_pos
);
} // end getrange()
} // class
?>
python解析mht文件_php解析mht文件转换成html的实例相关推荐
- python 时分秒毫秒_python将时分秒转换成秒的实例
处理数据的时候遇到一个问题,从数据库里导出的数据是时分秒的格式:hh:mm:ss ,现在我需要把它转换成秒,方便计算. 原数据可能分两种情况,字段有可能是文本字符串类型的,也有可能是时间类型,他们的处 ...
- python解析mht文件_php解析mht文件转换成html的实例详解
下面小编就为大家带来一篇php解析mht文件转换成html的实例.小编觉得挺不错的,现在就分享给大家,也给大家做个参考.一起跟随小编过来看看吧 php解析mht文件,使用编辑器打开可以看到base64 ...
- php解析mht,php解析mht文件转换成html的实例
php解析mht文件,使用编辑器打开可以看到base64编码所以,mht是可以转换成html的. /** * 针对Mht格式的文件进行解析 * 使用例子: * * function mhtmlPars ...
- php读取mht,php解析mht文件转换成html的实例
php解析mht文件转换成html的实例 发布于 2017-08-07 07:27:31 | 116 次阅读 | 评论: 0 | 来源: 网友投递 PHP开源脚本语言PHP(外文名: Hypertex ...
- 读取CSV文件内容,将其转换成JSON字符串输出
CsvToJsonUtil 工具类作用:读取CSV文件内容,将其转换成JSON字符串输出 转换工具类代码如下: package com.test.util;import java.io.*; impo ...
- python篮球-用Python把蔡徐坤打篮球视频转换成字符动画!
原标题:用Python把蔡徐坤打篮球视频转换成字符动画! 说到现在网络最火的梗,非"蔡徐坤打篮球"莫属.最近,蔡徐坤当仁不让地成为了娱乐圈被黑的最惨的明星. 自从2019年1月份, ...
- python处理时间格式时分秒_python将时分秒转换成秒的实例
处理数据的时候遇到一个问题,从数据库里导出的数据是时分秒的格式:hh:mm:ss ,现在我需要把它转换成秒,方便计算. 原数据可能分两种情况,字段有可能是文本字符串类型的,也有可能是时间类型,他们的处 ...
- python咋变汉语_python实现将汉字转换成汉语拼音的库
本文实例讲述了python实现将汉字转换成汉语拼音的库.分享给大家供大家参考.具体分析如下: 下面的这个python库可以很容易的将汉字转换成拼音,其中用到了一个word.data 的字典,可点击此处 ...
- python解析mht文件_php解析mht文件转换成html的方法
本篇文章主要介绍php解析mht文件转换成html的方法,感兴趣的朋友参考下,希望对大家有所帮助. php解析mht文件,使用编辑器打开可以看到base64编码所以,mht是可以转换成html的. / ...
- java代码将excel文件中的内容列表转换成JS文件输出
思路分析 我们想要把excel文件中的内容转为其他形式的文件输出,肯定需要分两步走: 1.把excel文件中的内容读出来: 2.将内容写到新的文件中. 举例 一张excel表中有一个表格: 我们需要将 ...
最新文章
- scheduled sampling_seq2seq
- [原]LVM管理问题解决
- 乌克兰农贸市场现在接受比特币BCH等加密货币
- php恶意代码,警惕WordPress主题functions.php包含的恶意代码
- 每天睡4小时上7门课
- IntelliJ IDEA 的 Build Project/Build Module/构建项目/构建模块
- 老男孩shell实战读书笔记 (6-10章节)
- 云服务器如何实现装虚拟机_如何在服务器上安装虚拟机呢?服务器虚拟机安装教程...
- 《天天数学》连载19:一月十九日
- 将一个项目中的图片存到另一个项目中_复盘一个Smart200小项目(2)
- 计算机基础远程教育答案,浙大远程教育2013年计算机作业答案-1-计算机基础知识题.docx...
- 随机抽取文件内容中的一行
- 不错的学习博客,有时间看看
- iOS 腾讯云IM UIKit 升级XCode11后, 调用语音(取消) 崩溃问题
- 《线性代数及其应用》系列笔记
- SpringCloud Greenwich版本集成OAuth2.0
- markdowm快捷键学习
- Region Proposal by Guided Anchoring论文解读
- struct files_struct和struct fdtable
- 阿里云物联网平台python_基于阿里云物联网平台,我们这样实现简易出入监控