【基本介绍】
Piwik中文版是一款以PHP5+MySQL技术为基础打造的开源网站访问统计工具,Piwik中文版绿色小巧,采用了插件扩展及开放API架构,可以让用户根据 自已的实际需求创建更多的功能。【官方介绍】
Piwik 是一套基于 PHP5+MySQL 技术构建的开源网站访问统计系统,前身是 phpMyVisites。Piwik 可以给你详细的统计信息,比如网页浏览人数,访问最多的页面,搜索引擎关键词等等流量分析功能。此外,它还采用了插件扩展及开放 API 架构,可以让用户根据自已的实际需求创建更多的功能。【功能特色】
1.Piwik中文版是一个PHP与MySQL的开放源代码的Web统计软件.。它给你一些对于你网站的实用统计报告,例如网页浏览人数, 访问最多的页面, 搜索引擎关键词等等 Piwik具有许多不同功能的插件,你可以添加新的功能或是移除你不需要的功能,同样可以安装在你的服务器上面,数据就保存在你自己的服务器上面。2.Piwik 支持插件,你可以通过插件扩展 Piwik 的功能,或者取消一些不需要的功能。用户的界面支持 Ajax 技术是可定制的,你可以轻松拖放控件,定制自己需要的报告。
3.用户单独具有自己的统计数据,而不是寄存在服务商那里,这样就可以更灵活的使用统计数据,不需要担心数据丢失问题。
4.Piwik 是安装在服务器端的统计工具,安装过程很简单,但是需要服务器支持 PHP5.1 与 MySQL 。安装时上传 Piwik 到服务器端,而后打开浏览器,Piwik 会自动运行安装,整个过程不超过 5 分钟。
5.现在 Piwik 已支持中文。
【安装步骤】
注意:安装Piwik的前提必须要安装Apache +PHP和MySQL,PHP 版本5.1.3 或以上,MySQL 版本 4.1 或以上
安装步骤:
准备工作
将下载的 piwik 安装包上传到服务器,具体什么位置不限,记住路径即可。我将 piwik 上传Apache部署的根目录下,(如我实在本机测试,所以就将Piwik放在C:\Program Files\Apache Software Foundation\Apache2.2\htdocs的目录下),
接着,在浏览器输入http://localhost:81/piwik/index.php(当然你也可以是域名访问)。
开始安装
1.打开 piwik 安装文件中的 index.php 文件,具体路径为http://localhost:81/piwik/index.php,你的路径根据域名和安装位置有所不同
进入欢迎页,如图:
2、点击 next 进入安装环境检测环节,具体需要什么样的环境请看这里,一切顺利的话就可以直接进入下一步了。
3、链接数据库,这和 wordpress 的数据库连接过程基本相同。第一项和最后一项不用改动,剩下依次填入数据库用户名,数据库密码和数据库名即可。
4、点击 next 继续,添加用户信息。填写用户名,密码,核对密码和电子邮件地址。这一步也可以在 piwik 后台完成。
5、登记需要统计的网站,填写网址即可。
6、点击 Go 继续,生成网站统计代码,并将代码添加到网页的适当位置。
7、安装结束。
【使用方法】
刚装好的Piwik是空空如也的,此时我们需要这个系统帮我们统计数据。目前Piwik支持两种采集用户访问记录的方式: JS追踪和访问日志追踪。JS追踪可定制型高,可以获取到用户的分辨率,浏览器插件等等,还可以捕获自定义变量。访问日志追踪(如apache的accesslog)可以追踪到用户的错误请求(如40X错误,有助于捕获到恶意用户和爬虫,蜘蛛等等),目前这两种追踪得到的数据还不支持合并。JS追踪
在管理设置-网站-右边即可看到"显示跟踪代码",如下图所示:
将此代码复制到web项目的footer中即可(即所有页面都嵌入这段相同的js代码,用于捕获用户的信息,如分辨率,浏览器UA,IP等),还可以按照官方文档,捕获自定义变量。
log追踪
log追踪无需修改web项目,但是必须要有登录服务器并读取accesslog的权限。
log追踪的过程是解析webserver的accesslog,然后通过piwik的API上传,最终在piwik页面上展示。
这个过程不用自己去实现了,piwik的压缩包中已经带有一个python脚本可以帮助我们完成这个工作了,该脚本存储于piwik目录下的misc/log-analytics/import_logs.py。
将这个脚本远程拷贝到目标服务器上,按照脚本的参数格式执行即可,我的命令行:
1./import_logs.py --url=http://192.168.1.106/piwik/ --idsite=1 --recorders=2 --token-auth=319fb461d3225905039551e861edde60 --enable-static --enable-bots --enable-http-errors --enable-http-redirects /var/log/apache2/access.log
使用--help参数即可看到这个脚本的命令行,只有一个--url参数是必须的,指明piwik的访问路径。
这里对我使用的参数做一下简介:
--idsite表明抓取到的信息上传到哪个序号对应的网站(这里的参数为1,代表解析的数据会统计到first_web这个网站中)
--token-auth这个参数是管理员的访问token,在系统页面最顶上的API点开即可看到,如下图所示。这个参数可以使用--login=LOGIN --password=PASSWORD这两个参数替代,必须是管理员的账户和密码。
--recorders使用多线程解析,默认为1,官方建议这个参数和核心数一致。
--enable-static --enable-bots --enable-http-errors这三个参数基本上把apache的accesslog能抓取到的全部信息都抓全了,抓取静态资源(jpg,png,js,css等非html的访问),抓取bots(不知道这个是什么,猜测是否是机器人?),抓取html错误码(如40X请求等等)
/var/log/apache2/access.logapache的accesslog存放路径,常见的webserver如nginx,lighthttpd等,脚本自带有解析引擎,无需别的参数,如果非常见webserver的话,加上--log-format-regex这个参数来自定义日志格式抓取。
当脚本执行完毕时,即可在piwik中看到网站的访问记录了,使用也很方便。长期使用可以写入crontab即可。
注意:
log解析的方式追踪比较慢,不适合实时追踪用户访问记录,建议每过几小时执行一次crontab,来定时解析log。
如果开启了--enable-static --enable-bots --enable-http-errors这三个参数,解析过程将会很缓慢(我这边大概十几条每秒),不要让crontab太频繁,会直接让mysql数据库超出连接而挂掉,我是每4小时执行一次crontab。