php把buffer转化为图片_长微博生成（将html转化为图片）原理浅析

在平时工作中有一些需求，简单而言就是需要将一些内容生成图片。简单的内容通过PhotoShop处理还行，但是类似于带表格等的内容，每次都通过PhotoShop进行处理太浪费时间。网上有很多类似于长微博等的生成工具，生成简单的图片还行，但是要使用富文本生成图片，则多需要money，于是便自己研究了一下基于PHP的实现。

需求及原理

基于PHP，将html内容生成图片(PNG，JPEG等)

实现方法

1. 直接通过图形函数生成

可以直接使用PHP中自带的GD库或imagick，将文字内容转换成为图片。这在处理纯文字内容的时候是很给力的，但是对于富文本内容来说却很吃力了，很难处理好。目前开源的有painty等，可以支持p、img等几个简单的html标签。

2. html->pdf->png

该方式即首先将html内容生成pdf文档，再将pdf文档转换成为图片。

html to pdf：目前较为成熟的方案包括tcpdf，HTML2PDF等，其实HTML2PDF也是使用的tcpdf的内核;

pdf to png：可以通过imagick php扩展。

目前基于该种方式的开源代码有html to image，其原理如下图所示。

核心代码为(摘自：http://buffernow.com/html-to-image-php-script/)：//获取某个URL地址的内容

echo file_get_contents('http://php.cn/');

//将内容转换成pdf文档

$html2pdf = new HTML2PDF('P', 'A4');

$html2pdf->writeHTML($html_content);

$file = $html2pdf->Output('temp.pdf','F');

//将pdf文档转换成图片

$im = new imagick('temp.pdf');

$im->setImageFormat( "jpg" );

$img_name = time().'.jpg';

$im->setSize(800,600);

$im->writeImage($img_name);

$im->clear();

$im->destroy();

这里使用了HTML2PDF的代码，其实个人建议使用tcpdf的，毕竟tcpdf的版本更新，功能更为强大。经过实际测试，tcpdf对中文、html格式等的支持更好，相对而言，HTML2PDF有点惨不忍睹，较长的中文会出现无法自动换行等基本错误。

但同时，这种方法存在一个较大的缺陷，当插入了图片等媒体后，经常会出现一页内无法放进去需要重新在另外一页进行排版的问题，从而生成的图片就会有较大的空白区域；同时每页的内容如果没有完全排满的话，生成的图片同样存在较大的空白区域，十分不美观。

因此，并不推荐这种方式。

3. 通过截图

该种方式类似于采用浏览器的截图功能，直接将某个URL地址的内容进行截图。相对前面两种方式而言：第一，对于富文本的html内容渲染更为方便、简单，直接生成html代码即可；第二，内容排版更为合理，不会出现pdf文档中存在的空白区域等问题；第三，对于中文的支持更为友好。

目前主要的开源项目包括：

khtml2png：基于Linux平台，可以将html转成图片格式，有如下要求：g++

KDE 3.x

kdelibs for KDE 3.x (kdelibs4-dev)

zlib (zlib1g-dev)

cmake

对于服务器而言，尤其是资源比较吃紧的VPS而言，安装一个KED有点花销太大。

CutyCapt及其兄弟版本IECapt：其中CutyCapt是基于Linux、Windows平台，IECapt基于Windows平台，支持svg,ps,pdf,itext,html,rtree,png,jpeg,mng,tiff,gif,bmp,ppm,xbm,xpm等多种格式，使用均较为简单，直接使用如下命令。

注意：CutyCapt的可执行命令在Windows平台和Linux平台下的大小写不太一致。./CutyCapt --url=http://www.php.cn --out=example.png

IECapt --url=http://www.php.cn/ --out=localfile.png

它的部署要求是：CutyCapt depends on Qt 4.4.0+.

但是它比khtml2png好的一点是它可以不用装X server，可以用Xvfb这种轻量级的东西，然后可以这样使用：xvfb-run --server-args="-screen 0, 1024x768x24" ./CutyCapt --url=... --out=...

通过对各种实现方式进行实际的对比，本人倾向于采用CutyCapt的方式。

具体实现过程

1、通过嵌入富文本编辑器，提供富文本编辑功能，同时可以提供对作者信息、版权标记、图片大小格式等的定制。

2、将提交的内容进行过滤，并生成htm/html文档，通过CSS对生成的文档内容进行格式渲染。

3、通过PHP执行CutyCapt命令，对生成的网页文件进行截图。

到这一步已经完全可以实现html内容生成图片的功能了，但CutyCapt生成的图片相对而言会比较大，因此还可以进一步进行优化。

4、通过imagick对生成的图片进行优化

imagick具有强大的图片处理功能，可以优化CutyCapt生成的图片的质量及大小，同时还可以方便地进行加水印等操作。

开发经验分享

在实际开发过程中碰到了各种问题，进行一些分享。

1、操作系统选择

CutyCapt及imagick都有Linux和Windows的版本，在Windows下面的开发、运行不存在较大的问题，按照正常步骤进行安装配置即可。

在Linux平台下，CutyCapt的安装教程可参考http://www.cszhi.com/20130305/cutycapt.html：

centos下安装cutycapt：

(1)安装qt47

增加qt47的源vim /etc/yum.repos.d/atrpms.repo

//加入如下内容

[atrpms]

name=CentOS $releasever – $basearch – ATrpms

baseurl=http://dl.atrpms.net/el$releasever-$basearch/atrpms/stable

gpgkey=http://ATrpms.net/RPM-GPG-KEY.atrpms

gpgcheck=1

enabled=1

[atrpms-testing]

name=CentOS $releasever – $basearch - ATrpms testing

baseurl=http://dl.atrpms.net/el$releasever-$basearch/atrpms/testing

gpgkey=http://ATrpms.net/RPM-GPG-KEY.atrpms

gpgcheck=1

enabled=1

//进行安装

yum update

yum install qt47

yum install qt47-devel

yum install qt47-webkit

yum install qt47-webkit-devel

2、安装cutycaptyum install svn

svn co https://cutycapt.svn.sourceforge.net/svnroot/cutycapt

mv cutycapt/CutyCapt /usr/local/cutycapt

cd /usr/local/cutycapt

qmake

qmake-qt47

3、安装xvfbyum install Xvfb

4、测试cutycapt截图xvfb-run --server-args="-screen 0, 1024x768x24" CutyCapt --url=http://www.php.cn --out=php.png

5、将xvfb置入后台运行Xvfb -fp /usr/share/fonts :0 -screen 0 1024x768x24 &

DISPLAY=:0 ./CutyCapt --url=http://www.php.cn --out=php.png

ubuntu下安装cutycapt

1、两条命令搞定apt-get install cutycapt

apt-get install xvfb

2、测试截图xvfb-run --server-args="-screen 0, 1024x768x24" CutyCapt --url=http://www.php.cn --out=php.png

中文乱码问题：

将windows下的中文字体上传至/usr/share/fonts目录，执行下命令fc-cache即可。

在这里，作者想说的是，尽量选择Ubuntu吧，安装方便；更重要的是，CentOS下面会出现各种问题，如CutyCapt: cannot connect to X server :99等，会让你非常郁闷，我甚至安装了新的包含Gnome、KDE桌面环境的操作系统仍无法解决，而在Ubuntu下面几乎不存在任何问题。

2、Web服务器的选择

因为截图功能涉及到PHP需要执行操作系统的CutyCapt命令，可以通过system()或者exec()函数。

作者分别使用了apache和Nginx两种Web服务器，在Nginx下会出现执行调用CutyCapt的PHP脚本无法运行的情况，会遇到比较麻烦的权限问题，http://alfred-long.iteye.com/blog/1578904中提供了一种解决方案，但作者没有测试成功。使用apache服务器则是一路畅通，不存在这个问题。

因此，作者建议选择Ubuntu+apache的组合，千万不要选择CentOS+Nginx，需要解决的麻烦问题太多，从而也容易造成一些不安全的因素。

安装代码如下：apt-get install apache2

apt-get install php5 libapache2-mod-php5

3、Ubuntu中安装imagickapt-get install php5-dev php5-cli php-pear //安装支持环境

apt-get install imagemagick //有可能不是最新版本，需要通过源代码安装最新版本

//源代码方式安装http://www.imagemagick.org/script/download.php

cd /usr/local/src

wget ftp://ftp.kddlabs.co.jp/graphics/ImageMagick/ImageMagick-6.8.7-0.tar.gz

tar xzvf ImageMagick-6.8.7-0.tar.gz

cd ImageMagick-6.8.7-0/

./configure && make && make install

apt-get install graphicsmagick-libmagick-dev-compat

pecl install imagick

echo extension=imagick.so >>/etc/php5/conf.d/imagick.ini

service apache2 restart

常见错误：

在运行pecl install imagick 时有以下出错提示：

checking if ImageMagick version is at least 6.2.4... configure: error: no. You need at least Imagemagick version 6.2.4 to use Imagick. ERROR: `/tmp/pear/temp/imagick/configure --with-imagick=hjw' failed

根据提示是没有安装Imagemagick或者Imagemagick版本不够，可以通过源代码的方式安装最新版本的Imagemagick。

4、Linux平台下的字体渲染

可以将Windows平台下的雅黑、宋体、楷体、黑体等常用中文字体安装到Ubuntu系统中，避免出现截图中的字体不好看的情况，同时也满足对富文本编辑中支持的字体进行渲染。

本文原创发布php中文网，转载请注明出处，感谢您的尊重！

php把buffer转化为图片_长微博生成（将html转化为图片）原理浅析相关推荐

wkhtmltoimage 卡住了_用rails做一个简单的长微博生成工具
长微博就是把文字转换成图片,主要用到的gem是imgkit. imgkit是一个通过open3来调用wkhtmltoimage生成图片的gem,源码不是很复杂,使用也很简单. 基本步骤如下: rail ...
canvas长微博生成功能实践
0x00 概述近日开发移动端H5遇到文字转图片的需求,类似长微博生成工具.由于需求简单,并未采用rasterizeHTML.js或html2canvas这类略显庞大的html转图片工具,而是采用ca ...
长微博生成（将html转化为图片）原理浅析
在平时工作中有一些需求,简单而言就是需要将一些内容生成图片 .简单的内容通过PhotoShop处理还行,但是类似于带表格等的内容,每次都通过PhotoShop进行处理太浪费时间.网上有很多类似于长 ...
html中图片链接生成文字,利用HTML5使文字转图片【长微博生成器】
RT,实现类似现在网上流行的长微博生成器,就是把长文字转成图片.当然功能比不上网上流传的,不知道网上那些用的什么方法.我这是用的HTML5的Canvas特性,也算一种实现吧. 示例地址: TextTo ...
c#如何wmf图片转换成png图片_每日一学：如何将png图片转换为jpg图片
背景最近在工作中会遇到需要将 png 图片转换为 jpg 图片的需求,主要原因也是 png 图片占的空间太大,如果图片数量上万张,可能就需要十几G的存储空间,所以希望转换为更小的 jpg 图片. 当 ...
python表格中插入图片_运维(1)python操作excel插入图片
worksheet.insert_image() insert_image****(row, col, image[, options]) 在工作表单元格中插入一张图片. 参数: row(int) - ...
怎么将excel中的url批量转化为图片_阿里云+Power BI，轻松实现图片可视化报告（一）...
经常有用户希望在Power BI报表中用"图片"对产品.品牌信息.工作人员--进行展示,例如,当查看某个业务员销售数据时,还想看到业务员的照片. 对应这个需求,Power BI是可 ...
java随机抓取网站上的图片_抓取一个网站特定的全部图片（JAVA）
1. 目的用五笔时,如果碰到不会拆的字,只好换回拼音.但这样做治标不治本,于是到网上找五笔反查工具.最后发现一个不错的网站--不仅有每个字对应的五笔码,还有其字根图.可惜的是,这是一个网站.换句说, ...
python pdf删除图片_【原创】python批量删除pdf图片水印（Xobject）的一种方法
1.说明: 下载到的pdf总会有一些水印,pdf文件水印添加方式除了acrobat adobe自带的以外,还有很多,所以去除水印方法也很多,这里介绍的也只是一种适用python批量删除图片水印Xobj ...

php把buffer转化为图片_长微博生成（将html转化为图片）原理浅析

php把buffer转化为图片_长微博生成（将html转化为图片）原理浅析相关推荐

最新文章

热门文章