目   录
第1章    业务巡检    4
第2章    系统巡检    4
2.1    BO巡检    4
2.1.1    AAA1    6
2.1.2    AAA2    8
2.1.3    BMS,IEPGM,BOSSAGENT    10
2.1.4    IEPG1    13
2.1.5    IPEG2    15
2.1.6    IPEG3    17
2.1.7    MAP1    19
2.1.8    MAP2    21
2.1.9    Mysq主    23
2.1.10    Mysq备    25
2.1.11    ORACLE1    27
2.1.12    ORACLE2    29
2.2    CND巡检    32
2.2.1    查看设备情况    32
2.2.2    查看系统整体的存储使用情况    32
2.3    PORTAL巡检    33
2.3.1    Portal_F1    34
2.3.2    Portal_L    36
2.4    VS巡检    38
第3章    前一天报表数据整理    39
3.1    BO报表数据    39
3.2    CDN报表数据    39
3.3    PORTAL报表数据    40
3.4    VS报表数据    40
第4章    故障处理    41
第5章    BUG跟进    错误!未定义书签。
第6章    常见故障处理    48
6.1    BO常见故障处理    48
6.1.1    点播失败问题    48
6.1.2    点播非正常退出问题    48
6.1.3    非实时注入无效问题    48
6.1.4    实时注入问题    错误!未定义书签。
6.1.5    栏目访问问题    错误!未定义书签。
6.2    CDN常见故障处理    78
6.2.1    日常故障处理:    78
6.2.2    紧急故障处理:    78
6.3    PORTAL常见故障处理    78
6.3.1    STB不能访问Portal    78
6.3.2    Portal页面能进入,但VOD节目、栏目信息不能显示    79
6.3.3    页面出现“请求失败”提示    81
6.4    VS常见故障处理    81
6.4.1    一按快进快退就提示播放结束的原因?(实例)    82
6.4.2    用户点播失败问题。(实例)    83
第7章    保障机制    41
7.1    故障级别    41
7.2    故障响应时间    41

第1章    业务巡检
1.1    手动巡检
1、    点播天华,华数,粤语专区,体验专区下的电影,每个专区10部,验证点播业务。
2、    进入回看页面,选择10-20个频道的里面的节目进行观看,验证回看业务。
3、    进入直播,选择10-20个频道进行时移操作,验证时移业务。

1.2    轮巡脚本巡检

第2章    系统巡检
2.1    BO巡检
1、    根据巡检表里的的巡检项,检查7+1个地市的BO服务器的系统信息,输出巡检报告。
2、    巡检项详见附件
巡检人员登记信息
巡检人员    更新日期
SERVER例查
Server名    状态
AAA1    见相应子表
AAA2    见相应子表
BMS    见相应子表
iepgm    见相应子表
bossagent    见相应子表
IEPG1    见相应子表
IEPG2    见相应子表
IEPG3    见相应子表
MAP1    见相应子表
MAP2    见相应子表
Mysq主    见相应子表
Mysq备    见相应子表
ORACLE1    见相应子表
ORACLE2    见相应子表

2.1.1    AAA1

广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              正常
被检查主机IP地址    操作系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.16.240.141    Red Hat Enterprise Linux Server release 5.3 64位    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意    内存使用率高于百分之50    服务器正常          
            交换区使用情况    
free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    低于15%    正常          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            时间服务器    #ntpdate 172.16.240.161    检查时钟误差    无明显偏差    正常          
            系统日志    日志路径
tail -f /usr/local/b038/aaa/aaa-server/bin/aaa/log/info/app-info.log 查看系统info日志,看是否有打印    对主机进行检查             查看info日志是否在正常打印    正常    正常          
        应用巡检    应用程序    查询服务命令:ps -ef|grep java
看是否存在aaa、dcss服务    进程是否存在    运行    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    正常    正常          
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    AAA2

广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              正常
被检查主机
IP地址    操作系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.16.240.142    Red Hat Enterprise Linux Server release 5.3 64位    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意    内存使用率高于百分之50    服务器正常          
            交换区使用情况    
free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    低于15%    正常          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            时间服务器    #ntpdate 172.16.240.161    检查时钟误差    无明显偏差    正常          
            系统日志    日志路径
tail -f /usr/local/b038/aaa/aaa-server/bin/aaa/log/info/app-info.log 查看系统info日志,看是否有打印    对主机进行检查             查看info日志是否在正常打印    正常    正常          
        应用巡检    应用程序    查询服务命令:ps -ef|grep java
看是否存在aaa、dcss服务    进程是否存在    运行    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    正常    正常          
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    BMS,IEPGM,BOSSAGENT
广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              正常
被检查主机IP地址    系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理
情况    后续
措施
172.16.240.138    Red Hat Enterprise Linux Server release 5.3    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意    内存使用率大于百分之50    服务器正常          
            交换区使用情况                                            free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    低于35%    正常          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            系统日志    日志路径                                                                      1.cd /usr/local/b038/bms/cosihp-bms/bms/log/info          2.cd/usr/local/b038/iepgm/iepgm-jetty/iepgm/log/info                                                   3.cd /usr/local/b038/bossagent/coship-bossagent/bossagent/log/info                 在日志目录下查看日志打印命令:tail -f app-info.log    info级别打印正常    正常    正常          
            时间服务器    # ntpdate 172.16.240.161    检查时钟误差    无    正常          
        应用巡检    应用程序    查询服务命令:ps -ef|grep java
看是否存在bms、iepgm、bossagent服务    进程是否存在    运行    正常          
            登陆BMS/iepgm    登陆BMS/iepgm客户端,数据查询和和编辑
bms登录地址:http://172.16.240.138:7000/bms/
iepgm登陆地址:http://172.16.240.138:9090/iepgm/login.action    无法登陆或者显示数据异常    能正常登陆    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    正常    正常          
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           

2.1.1    IEPG1
广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              正常
被检查主机IP地址    操作系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.16.240.151    Red Hat Enterprise Linux Server release 5.3 64位    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意    内存使用率高于百分之50    服务器正常          
            交换区使用情况    
free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    高于80%    警告          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            时间服务器    #ntpdate 172.16.240.161    检查时钟误差    无明显偏差    正常          
            系统日志    日志路径
tail -f /usr/local/b038/iepg/iepg-jetty/iepg/log/info/app-info.log   查看系统info日志,看是否有打印    对主机进行检查             查看info日志是否在正常打印    正常    正常          
        应用巡检    应用程序    查询服务命令:ps -ef|grep java
看是否存在iepg服务    进程是否存在    运行    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    正常    正常          
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    IPEG2

广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              正常
被检查主机IP地址    操作系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.16.240.152    Red Hat Enterprise Linux Server release 5.3 64位    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意    内存使用率高于百分之50    服务器正常          
            交换区使用情况    
free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    高于80%    警告          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            时间服务器    #ntpdate 172.16.240.161    检查时钟误差    无明显偏差    正常          
            系统日志    日志路径
tail -f /usr/local/b038/iepg/iepg-jetty/iepg/log/info/app-info.log   查看系统info日志,看是否有打印    对主机进行检查             查看info日志是否在正常打印    正常    正常          
        应用巡检    应用程序    查询服务命令:ps -ef|grep java
看是否存在iepg服务    进程是否存在    运行    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    正常    正常          
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    IPEG3
广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              正常
被检查主机IP地址    操作系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理
情况    后续措施
172.16.240.153    Red Hat Enterprise Linux Server release 5.3 64位    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意    内存使用率高于百分之50    服务器正常          
            交换区使用情况    
free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    高于80%    警告          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            时间服务器    #ntpdate 172.16.240.161    检查时钟误差    无明显偏差    正常          
            系统日志    日志路径
tail -f /usr/local/b038/iepg/iepg-jetty/iepg/log/info/app-info.log   查看系统info日志,看是否有打印    对主机进行检查             查看info日志是否在正常打印    正常    正常          
        应用巡检    应用程序    查询服务命令:ps -ef|grep java
看是否存在iepg服务    进程是否存在    运行    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    正常    正常          
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    MAP1

广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              正常
被检查主机IP地址    操作系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.16.240.161    Red Hat Enterprise Linux Server release 5.3 32位    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意    内存使用率小于百分之20    服务器正常          
            交换区使用情况    
free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    低于10%    正常          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            时间服务器    #ntpdate 172.16.254.7    检查时钟误差    无明显偏差    正常          
            系统日志    日志路径
tail -f /usr/local/b03/sm/coshipmap/log/runlog4map.log
 查看系统info日志,看是否有打印    对主机进行检查             查看info日志是否在正常打印    正常    正常          
        应用巡检    应用程序    查询服务命令:ps -ef|grep MAP
看是否存在MAP服务    进程是否存在    运行    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    正常    正常          
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    MAP2
广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              正常
被检查主机IP地址    操作系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.16.240.162    Red Hat Enterprise Linux Server release 5.3 32位    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意    内存使用率小于百分之20    服务器正常          
            交换区使用情况    
free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    低于10%    正常          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            时间服务器    #ntpdate 172.16.240.161    检查时钟误差    无明显偏差    正常          
            系统日志    日志路径
tail -f /usr/local/b03/sm/coshipmap/log/runlog4map.log
 查看系统info日志,看是否有打印    对主机进行检查             查看info日志是否在正常打印    正常    正常          
        应用巡检    应用程序    查询服务命令:ps -ef|grep MAP
看是否存在MAP服务    进程是否存在    运行    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    正常    正常          
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    Mysq主
广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
               远程    服务器              正常
检查内容    系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.16.240.171    Red Hat Enterprise Linux Server release 5.3    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    
top: 观察memory项    低于50时,值得注意    内存使用率低于百分之60    服务器正常          
            交换区使用情况     free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    低于10%    正常          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            系统日志    last:观察最近的主机登录情况
vim /var/log/messages文件内容    对不明主机进行检查    无    正常          
            时间服务器    ntpdate 172.16.240.161               检查时钟误差    无明显偏差    正常          
        应用巡检    MYSQL进程    ps -ef |grep mysql     进程是否存在    运行    正常          
            MYSQL登陆    输入命令mysql -u root -p密码    正常登陆数据库    正常登陆    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    无    正常          
            风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
        硬件巡检    设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    Mysq备
广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
               远程    服务器              正常
检查内容    系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.16.240.172    Red Hat Enterprise Linux Server release 5.3    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于5%    正常          
            内存使用情况    
top: 观察memory项    低于50时,值得注意    内存使用率低于百分之10    服务器正常          
            交换区使用情况     free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    低于10%    正常          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            系统日志    last:观察最近的主机登录情况
vim /var/log/messages文件内容    对不明主机进行检查    无    正常          
            时间服务器    ntpdate 172.16.240.161    检查时钟误差    无明显偏差    正常          
        应用巡检    MYSQL进程    ps -ef |grep mysql     进程是否存在    运行    正常          
            MYSQL登陆    输入命令mysql -u root -p密码    正常登陆数据库    正常登陆    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    无    正常          
            风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
        硬件巡检    设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    ORACLE1

广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
               远程    服务器              正常
检查内容    系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理
情况    后续
措施
172.30.0.66    Red Hat Enterprise Linux Server release 5.3    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于10%    正常          
            内存使用情况    
top: 观察memory项    低于50时,值得注意    内存使用率大于百分之80    服务器正常          
            交换区使用情况     free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于15%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    低于50%    正常          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            系统日志    last:观察最近的主机登录情况
vim /var/log/messages文件内容    对不明主机进行检查    无    正常          
            时间服务器    ntpdate 172.16.240.161            检查时钟误差    无明显偏差    正常          
        应用巡检    oralce进程    ps -ef |grep oracle    进程不存在正常    运行    正常          
            oracle登陆    通过客户端登录    正常登陆数据库    正常登陆    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    无    正常          
            风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
        硬件巡检    设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.1.1    ORACLE2
广东省网异构项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
               远程    服务器              正常
检查内容    系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.30.0.67    Red Hat Enterprise Linux Server release 5.3    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因    cpu使用率小于10%    正常          
            内存使用情况    top: 观察memory项    低于50时,值得注意    内存使用率大于百分之80    服务器正常          
            交换区使用情况     free: 观察Swap行的值    当空闲值低时,值得注意    交换分区使用情况低于1%    正常          
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现    无    正常          
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况    低于65%    正常          
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包    无    正常          
            系统日志    last:观察最近的主机登录情况
vim /var/log/messages文件内容    对不明主机进行检查    无    正常          
            时间服务器    1.service ntpd stop                    2.ntpdate 172.30.0.66              3.service ntpd start    检查时钟误差    无明显偏差    正常          
        应用巡检    oralce进程    ps -ef |grep oracle    进程不存在正常    运行    正常          
            oracle登陆    通过客户端登录    正常登陆数据库    正常登陆    正常          
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音    无    正常          
            风扇检查    纸片或者手检测风扇是否运作    风扇停止运作    转速正常    正常          
        硬件巡检    设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司,宝德raid直接填写结果                         
                                           
                                           

2.2    CND巡检
2.2.1    查看设备情况
登陆CDN管理界面,进入: Monitor>> System Level>>System Health  ,如果在该界面,所有服务器的状态指示灯都为绿色,表示设备网络连接正常、硬盘运行正常、程序运行正常。

2.2.2    查看系统整体的存储使用情况
登陆CDN管理界面,进入: Monitor>> System Level>> System Snapshot  。可以查看到系统整体的存储使用情况。如果“Active Ingests”值大于等于144,表示目前系统直播注入频道数量正常。

2.3    PORTAL巡检
1、    根据巡检表里的的巡检项,检查7+1个地市的Portal服务器的系统信息,输出巡检报告。
2、    巡检项详见附件
巡检人员登记信息
巡检人员    更新日期
SERVER例查
Server名    状态
Portal_F    见相应子表
Portal_L    见相应子表

2.3.1    Portal_F1
广东省网高清互动平台项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              正常
被检查主机IP地址    操作系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
172.16.241.13    Red Hat Enterprise Linux Server release 5.4 64位    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因                  
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意                  
            交换区使用情况    
free: 观察Swap行的值    当空闲值低时,值得注意                  
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现                  
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况                  
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包                  
            时间服务器    #ntpdate 172.16.240.161    检查时钟误差                  
        应用巡检    应用程序    查询服务命令:ps -ef|grep java
看是否存在Portal服务    进程是否存在                  
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音                  
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作                  
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司.                         
                                           
                                           

2.3.2    Portal_L

广东省网高清互动平台项目系统例行巡检表
时间:    检查人         检查方式    项目&被检查设备    IP地址    机器运行天数    总体检查结论
                    服务器              
被检查主机
IP地址    操作系统    巡检类别    检查项    检测指标或方法    警戒指标    检测结果    结论    处理情况    后续措施
    Red Hat Enterprise Linux Server release 5.4 64位    系统巡检    CPU使用情况    top:实时观察CPU idle指标    如果idle时常处于0,则需要检查引起大量CPU消耗的原因                  
            内存使用情况    vmstat:观察free值
top: 观察memory项    低于50时,值得注意                  
            交换区使用情况    
free: 观察Swap行的值    当空闲值低时,值得注意                  
            系统进程    ps aux    有无多个相同的进程名或僵尸进程出现                  
            文件系统使用情况    df -h:检查空间使用达到90%的文件系统    尤其是使用情况                  
            网络状况    ping:查看到网关地址的time值是否小于10ms    无频繁丢包                  
            时间服务器    #ntpdate 172.16.240.161    检查时钟误差                  
        应用巡检    应用程序    查询服务命令:service keepalived status
看是否存在负载设备服务    进程不存在                  
            硬件指示灯    查看前面板告警指示灯    告警指示灯常亮且发生告警声音                  
        硬件巡检    风扇检查    纸片或者手检测风扇是否运作    风扇停止运作                  
            设备检查    根据设备具体厂商及巡检说明运行硬件检测工具并把结果反馈公司.                         
                                           
                                           

2.4    VSS巡检

第3章    前一天报表数据整理
3.1    BO报表数据
1、    通过目前现有的报表系统统计7个地市的时移,回看,点播清单。
2、    通过SQL语句查询总用户数,当日的开户,销户,在线用户数。
3、    通过脚本获取当日访问BO的次数。
4、    将这些数据整理填入到报表数据表格并提交。

3.2    CDN报表数据
1、    登陆CDN管理界面,进入: Monitor>> System Level>> System Snapshot。可以查看到目前CDN存储的使用情况,包含“存储总量”、“使用总量”、“可用总量”;
2、    登陆CDN管理界面,进入:Report >> System Level >> System Level。选择“Cache/Fill Bandwidth”再选择“Start Date”,再选择一台Cache的IP地址,并点击“Display”进行查看 。如下图:
 
3、    点击“Display”后,在新画面的正下方,点击“Download”,可以将该Cache服务器的流量报表数据下载到本地。如下图:

3.3    PORTAL报表数据
1、登录ftp服务器ftp://172.16.241.17,用户名:report 密码:report;
2、将前一天各portal服务器的总访问量数据文件拷贝至本地,按地市进行统计,目前各地市都是两台Portal服务器,文件名格式:日期_地市简称_服务器标识_服务器序号.log;
3、将统计数据发送给相关人员。

3.4    VSS报表数据
3.4.1    影莅驰VSS报表数据
1、在IE地址栏输入:http://172.16.241.70/report/index.php
2、选择日期需要导出报表日期(数据是选择日期的00:00:00-23:55:00时间段数据抽样)
3、然后输入用户名输入:admin、密码:gdvss,点击  export  按钮就会导出所选日期的报表。
3.4.2    思华VSS报表数据
1、使用gdcatv帐号登录服务器,密码另外单独提供;
2、使用命令cd /data/vssreport/2012/12文件夹,(红色标注安实际时间生成)报表会按时间生成当天的报表,名称格式如下:vss_20121213.xls;
3、使用sz vss_当天报表.xls  把数据报表传输到本地;

第4章    运维保障机制

4.1    故障级别
目前分为三种级别,如下:
致命:指由于故障导致整个系统或者主营业务停止服务的系统事件。
严重:指业务流程存在异常导致业务无法正常开展(如无法完成在线订购,或节目上架,或计费不准确等事件,但不影响已购买用户点播节目)的,严重影响用户体验和业务运营的系统事件;
一般:指除重大和严重故障之外的,对用户体验和业务运营不构成严重影响的系统事件。
 
4.2    故障响应时间
标准为:
等级    紧急程度    响应时间    处理时间
致命    紧急    立即    2小时内恢复系统
严重    紧急    4小时内    1-2天内
严重    非紧急    一个工作日内    根据版本规划
一般    紧急    一个工作日内    3个工作日内
一般    非紧急    一个工作日内    根据版本规划

4.3    系统恢复时间
当系统设备出现故障时,运维工程师在接到客户故障申告并到达现场后,会将故障于6小时内恢复系统的正常运行,保证系统平台可用,并收集现场信息以便完成故障分析。
4.4    不间断故障处理
运维工程师在到达客户现场后,在无特殊情况下会开始进行不间断服务的故障排除,直至系统恢复正常运行。
4.5    故障升级管理
当系统出现疑难问题不能立即解决时,运维工程师会将问题升级到二线技术支持分析团队进行解决;若是第三方设备,将升级到原厂要求进行及时解决。
运维工作将会建立升级流程及相应机制,升级管理由专职技术支持服务经理全程负责协调、监控,直至为客户解决问题为止。
4.6    故障分析报告
在系统恢复正常运行后,运维工程师会对系统运行情况进行跟踪,并结合故障现场信息对故障产生原因进行分析,3个工作日内提交故障分析报告,对后续改进提出技术建议。
4.7    政治保障维护服务
根据运营中心要求,运维工程师可提供电话、远程及现场的重大节假日前系统检查、节假日专职运维保障及其他重大事项运维保障支持服务。

第5章    故障处理
5.1    故障处理管理制度
5.1.1    故障发现与报告
第1条.    任何人发现或收到故障报告后,应及时报告项目相关负责人,不得隐瞒、拖延、误报或谎报。
第2条.    故障上报的方式包括:当面汇报、电话、短信、邮件等。
第3条.    对于致命和严重故障必须第一时间以最快方式上报项目组重要负责人员
5.1.2    故障现场保护
第4条.    运维值班人员收到故障报告后,应在第一时间保护好项目现场(包括抓取日志、线程状态等信息),以便后续进行故障分析。
第5条.    保护现场的处理时间不得超过10分钟,在非高峰期,在短时间内不能找出问题的原因,可以申请恢复部分服务器,保留其中一台供开发人员分析。
第6条.    运维值班人员除外的其他人员在未得到项目总监、运营中心负责人同意的情况下,不得擅自操作或重启系统。
5.1.3    系统恢复与故障处理
第7条.    运维值班人员在提取故障现场和初步了解故障原因后,必须马上制定系统恢复方案,并报告项目总监,根据项目总监决定按照方案恢复系统。
第8条.    恢复系统后,需要验证各业务是否正常,并酌情监控系统状态,直到确定系统正常运行。
第9条.    恢复系统后,应该及时通知运营中心。
第10条.    如无法进行远程处理,相关技术人员必须立即赶往现场。
5.1.4    故障分析
第11条.    项目总监应及时组织相关人员对故障进行分析,找出故障发生的根本原因。
第12条.    对于致命或严重问题应该提出相应的解决方案,如果在近期内无法彻底解决问题的,应该提出临时解决方案,避免故障再次发生。
第13条.    方案必须考虑对现有系统的影响,应尽量预测和规避各种风险。
第14条.    对于发现的故障必须编写故障报告,并向运营中心讲明原因和处理方案。如需规划修订版本,需将版本计划反馈给客户。
第15条.    问题分析清楚后需要将致命、严重故障的原因及处理方案形成故障报告知会项目组相关领导及运营中心。
5.1.5    方案实施
第16条.    在项目相关人员将问题原因分析清楚,并向运营中心汇报完毕后,如果要对系统进行更改,项目总监/交付代表应该及时向客户提出书面实施申请,在获得同意的情况下及时组织相关人员实施方案。
第17条.    在未经运营中心和项目总监同意的情况下不得擅自实施方案。
第18条.    实施过程必须严谨、细致,各类操作都必须结对进行(一名操作人员,一名监督人员)。
5.1.6    问题跟踪
第19条.    项目管理应该对所有的项目问题进行跟踪和管理,掌握问题的处理情况和进展,解决过程中如果有新的情况出现,应及时向项目总监汇报。
5.1.7    案例存档与经验总结
第20条.    对于致命和严重问题的解决,应形成案例并归档,作为重要财富资源保存。
第21条.    应该将导致故障发生的重要参数或系统资源使用情况列入日常巡检项目或工作检查单(CheckList),以防故障再次发生。

5.2    故障处理流程
一、    故障处理流程图如下图所示:
 
二、    故障处理流程操作指引如下:
    步骤 1    维护工程师通过用户投诉、告警等方式发现故障。
    步骤 2    维护工程师接收到故障信息后,通过消息跟踪、日志分析、session分析等方法,判断该故障是否为紧急故障。(如果为紧急故障,请按照紧急故障处理流程进行处理。紧急故障的业务恢复后,再对故障进行分析,可参考一般故障的处理流程。如果为一般故障,请按照一般故障定位与处理步骤对故障进行清除。)
    步骤 3    如果按照巡检的定位方法和处理步骤已经清除了故障,请输出故障处理报告。
    步骤 4    如果《系统巡检指南》介绍的定位方法和处理步骤不足以定位和清除故障,请运营商维护工程师收集系统故障信息。
    步骤 5    运营商维护工程师将系统故障信息向龙视传媒技术支持人员反馈。
    步骤 6    龙视传媒公司技术服务工程师远程指导运营商维护工程师进行故障定位和处理。

三、    致命故障处理流程

四、    严重故障处理流程

五、    一般故障处理流程

第6章    常见故障处理
6.1    BO常见故障处理
6.1.1    更换智能卡未重启机顶盒导致的点播失败
    现象描述
1、    更换智能卡后,点播失败。
2、    此时查看AAA日志,可看到“非法的智能卡信息”的相关日志信息。
3、    查看日志命令如下:
tail -f /usr/local/aaa/aaa-server/bin/aaa/log/info/app-info.log
    原因分析
可能是以下原因:
1、    更换智能卡后,未重启机顶盒,即未重新激活智能卡来获取新的用户标识,导致用户身份与卡号不一致。
    问题解决
1、    重启机顶盒即可。

6.1.2    时移/频道回看时点播失败
    现象描述
1、    时移、频道回看时,点播失败,常见错误码为:663。
    原因分析
可能是以下原因:
2、    当录制资产时间 < 节目单时长时,在RTM中检查录制资产是否正常同步到AAA,或当前点播的录制资产是否录制失败。
3、    当录制资产时间 > 节目单时长时,请检查是否同在一个时间点存在两个时间点相同的有效录制资产。
4、    当录制资产时间 = 节目单时长时,正常情况,此时需要到VS检查录制资产文件是否正常。
    问题解决
1、    在AAA的日志文件中查看下发的节目单的开始与结束时间。
查看日志命令如下:
tail -f /usr/local/aaa/aaa-server/bin/aaa/log/info/app-info.log
下例中蓝色部分是节目单的开始与结束时间。
节目单时长 =endTime - startTime
[INFO][2011-08-01 04:10:44,710][com.coship.dhm.aaa.service.services.AbstractNGodService.execute(AbstractNGodService.java:35)][com.coship.dhm.aaa.service.vo.req.ChannelSelectionStartReq@38957573[portalId=1,client=8757002164819454,account=50512,channelId=1,startDateTime=20110801041028,endDateTime=<null>,assetId=<null>]]
[INFO][2011-08-01 04:10:44,726][com.coship.dhm.aaa.service.services.AbstractNGodService.execute(AbstractNGodService.java:69)][ result:com.coship.dhm.common.uif.vo.ReturnMessage@4259942d[returnCode=0,errorMessage=成功,response=<null>] ; resp :com.coship.dhm.aaa.service.vo.resp.ChannelSelectionStartResp@70f3863[purchaseToken=1B8EA785DA7A69774C5E39AFE790C917,startTime=20110801014800,endTime=20110801045800]]
2、    查看播放列表的开始与结束时间,下例中蓝色部分是描述的录制资产信息。
播放列表的开始与结束时间= 录制资产A(end_npt- start_npt)+录制资产B(end_npt- start_npt)+……+录制资产N(end_npt- start_npt)
[INFO][2011-08-01 04:10:44,770][com.coship.dhm.aaa.service.services.AbstractNGodService.execute(AbstractNGodService.java:35)][com.coship.dhm.aaa.service.vo.req.RequestPlaylistReq@3610613[SMName=COSHIP_SM,sessionID=cd5a405c65b84e0e9756f2ab3822624e,deviceID=8757002164819454,locality=<null>,usage=Start,PT=1B8EA785DA7A69774C5E39AFE790C917]] [INFO][2011-08-01 04:10:44,787][com.coship.dhm.aaa.service.services.AbstractNGodService.execute(AbstractNGodService.java:69)][ result:com.coship.dhm.common.uif.vo.ReturnMessage@324e8054[returnCode=0,errorMessage=成功,response=<null>] ; resp :com.coship.dhm.aaa.service.vo.resp.RequestPlaylistResp@3fcb2499[playlistID=53020,bitRate=8789.062,startIndex=1,startNPT=180000,ContentRef=[com.coship.dhm.aaa.service.vo.resp.PlayInfoMsg@31cfd987[providerID=coship,assetID=REAL1312091129101528,start_npt=180,end_npt=2700,trickModesRestricted=<null>], com.coship.dhm.aaa.service.vo.resp.PlayInfoMsg@44d2479d[providerID=coship,assetID=REAL1312096535101533,start_npt=0,end_npt=1801,trickModesRestricted=<null>]]]]
3、    故障分析。
    当录制资产时间 < 节目单时长时。
需要到RTM检查录制资产是否正常同步到AAA,或当前点的录制资产是否录制失败。
    当录制资产时间 > 节目单时长时。
请检查是否在同一个时间点存在两个时间点相同的有效录制资产。
    当录制资产时间 = 节目单时长时。
正常情况,此时需要到VS定位,录制资产文件是否正常。
----结束

6.1.3    录制资产不存在导致的频道点播失败
    现象描述
1、    AAA后台日志打印录制资产不存在,导致点播失败。
    原因分析
可能是以下原因:
1、    原因一:BMS(CMS)没有将最新的录制资产同步到AAA数据库。
2、    原因二:BMS(CMS)同步录制资产到AAA时失败。
    问题解决
1、    根据ChannelId(频道ID),以及录制资产的开始时间和结束时间在AAA数据库的T_AAA_REALASSET表中查询指定时间内的录制资产信息。
具体查询语句如下:
select *  from T_AAA_REALASSET  where CHANNEL_ID = 频道ID
and STATUS = 1
and ( (START_TIME >= 开始时间 and START_TIME < 结束时间)
or(END_TIME > 开始时间 and END_TIME < 结束时间)
or(START_TIME <=开始时间 and END_TIME > 结束时间));
2、    当AAA数据库中没有录制资产信息时,查看AAA日志打印的开始时间和结束时间是否正确。
如可用的录制资产为7点至9点时,而频道点播的开始时间和结束时间都大于录制资产结束时间时,此时需要IEPG技术人员确认是否有误;
如果无误,需要CMS技术人员查看是否将最新节目单、或节目单变更后的录制资产信息同步给AAA。
----结束

6.1.4    按次点播时提示用户余额不足
    现象描述
1、    按次点播时,提示用户余额不足。
    原因分析
可能是以下原因:
1、    用户账户的余额不足。
2、    用户的信用度过低。
    问题解决
1、    在AAA数据库的T_USER_ACCOUNT表中,查看REMAIN_CREDIT字段的值是否过低(剩余信用额度过低),如果过低请联系相关人员进行充值操作。

6.1.5    录制资产不存在导致的频道点播失败
    现象描述
1、    AAA后台日志打印录制资产不存在,导致点播失败。
    原因分析
可能是以下原因:
1、    原因一:BMS(CMS)没有将最新的录制资产同步到AAA数据库。
2、    原因二:BMS(CMS)同步录制资产到AAA时失败。
    问题解决
1、    根据ChannelId(频道ID),以及录制资产的开始时间和结束时间在AAA数据库的T_AAA_REALASSET表中查询指定时间内的录制资产信息。
具体查询语句如下:
select *  from T_AAA_REALASSET  where CHANNEL_ID = 频道ID
and STATUS = 1
and ( (START_TIME >= 开始时间 and START_TIME < 结束时间)
or(END_TIME > 开始时间 and END_TIME < 结束时间)
or(START_TIME <=开始时间 and END_TIME > 结束时间));
2、    当AAA数据库中没有录制资产信息时,查看AAA日志打印的开始时间和结束时间是否正确。
如可用的录制资产为7点至9点时,而频道点播的开始时间和结束时间都大于录制资产结束时间时,此时需要IEPG技术人员确认是否有误;
如果无误,需要CMS技术人员查看是否将最新节目单、或节目单变更后的录制资产信息同步给AAA。
----结束
6.1.6    鉴权故障
    现象描述
1、    按次点播时,提示用户余额不足。
    原因分析
可能是以下原因:
1、    用户不是有效用户。
2、    订购关系不存在。
3、    鉴权时传过来的userCode在t_user表中是不存在。
    问题解决
1、    在info日志中找到该用户的的鉴权日志。
根据日志中的usercode去查询T_User表,看该用户是不是有效用户。
日志路径:/usr/local/aaa/aaa-server/bin/aaa/log/info/app-info.log
如果不是有效用户,请给该用户开户或在BOSS中查看该用户是否已经注销,不能在使用。
2、    如果是有效用户,在根据User_ID和prodofferingCode去订购关系表(T_subscription)中查询是否存在有效的订购关系。
如果不存在有效的订购关系,请在boss中增加订购关系。

6.1.7    激活失败
    现象描述
1、    提示无效卡或提示用户不存在。
    原因分析
可能是以下原因:
1、    智能卡未正确放置。
2、    未开户,或已开户但用户状态错误。
3、    激活AAA已返回成功,但机顶盒NTP时间不同步。
    问题解决
1、    问题一:检杳智能卡是否正确放置。
如未正确放置,请参见机顶盒的说明书正确放置智能卡。
2、    问题二:在AAA数据库的T_USER表中,查看SMARTCARD_ID字段是否有该卡的编号,且查看STATUS字段的值是否为01。
−    如果不存在智能卡编号,说明未开户,请通过BOSS或BOSS测试桩开户。
−    如果STATUS字段的值不为01,请通过BOSS或BOSS测试桩修改用户状态为01。
3、    问题三:检查机顶盒的NTP时间是否与NTP服务器时间同步。
如果不同步,请在机顶盒中正确设置NTP服务器的IP地址。

6.1.8    IEPGM的“影片维护”页面无媒资显示  (同步问题有可能是IEPGM 数据库升级错误,或者数据库错误)
    现象描述
1、    BMS已同步媒资到iEPGM,但iEPGM系统的“影片维护”页面中没有显示该资源。
    原因分析
1、    BMS中导入的媒资信息审核通过后,如果未打包成产品、商品并审核通过,媒资信息仅会同步到iEPGM数据库,但不会在iEPGM页面显示。
    问题解决
1、    检查该资源是否被打包成产品。
如果未被打包成产品,请在BMS系统的“产品维护”页面,新增产品并将资源添加进去。
2、    如果资源已被打包成产品,请检查该产品是否有打包商品。
如果未被打包成商品,则在BMS系统的“商品管理”页面,新增商品并打包包含该资源的产品。
3、    在iEPGM数据库中检查打包的产品、商品、产品资源关联关系是否已正常同步到iEPGM(相对应的栏目,如省网的出现“已商用”,地市的出现“已上架”,导致“最新上架”的影片状态不一致,就是中心栏目跟产品的关联关系没有同步到地市)。
select * from t_column_po t where t.COLUMN_ID='' 查询栏目和产品的关联关系是否同步到地市了,同时看下iepgm省中心的同步表,看有同步报错的没有.
产品信息表:t_prodoffering
商品信息表:t_iepg_goods
产品资源关联关系表:t_po_resource
----结束

6.1.9    栏目已上架的媒资顺序不对
    现象描述
1、    栏目中上架的资源顺序和需要在机顶盒上显示的资源顺序不一致。
    原因分析
1、    IEPGM中的资源顺序未按照排序规则正确排序。
    问题解决
1、    可在iEPGM“影片管理”页面的“排序”列设置上架影片在Portal页面的展示顺序。
进入iEPGM的“影片管理”页面。
在栏目“已上架”标签中,选择相应的媒资,在“顺序”列的输入框中输入排序数字
2、    输入排序顺序时,请参见如下规则:按照“排序”列的数字由大到小进行显示,排序数字相同时,则按上架的顺序展示,后上架的媒资排在前面;如影片A、B、C依次上架,上架后“排序”列的数字依次为1、2、2,则影片在终端页面的展示顺序为C、B、A。
----结束
6.1.10    媒资/产品/商品未成功同步到IEPGM
    现象描述
1、    BMS系统的媒资、产品、商品无法同步到IEPGM。在BMS系统的“系统管理 > 同步管理”页面中查看同步消息错误码为-1。
    原因分析
可能是以下原因:
1、    原因一:IEPGM系统没有启动。
2、    原因二:BMS中配置的IEPGM的IP地址和端口号错误。
    问题解决
1、    登录iEPGM系统,输入如下命令或直接登录iEPGM系统检查IEPGM系统是否启动。
ps -ef|grep java
如果没有启动,请启动IEPGM系统。
cd /usr/local/iepgm/iepgm-jetty
./startJetty.sh
2、    IEPGM已启动时,请检查BMS中配置的IEPGM的路径是否正确。
以root用户登录BMS所在服务器。
打开“uif-sys-address-config.xml”文件。
文件路径:/usr/local/bms/coship-bms/bms/conf/uif_config/uif-sys-address-config.xml
修改蓝色字体标识的参数值。
                        <!-- 同步给IEPG的同步配置文件 -->
                        <endpoint>
                                <name>iepg</name>
                                <inbound>
<inboundname>iepg.inbound.endpoint</inboundname>
                                        <inboundurl>iepg_inbound</inboundurl>
</inbound>
                                <outbound>
<outboundname>iepg.outbound.endpoint</outboundname>
                        <!-- iEPGM的IP地址和端口号-->
<outboundurl>http://172.20.101.13:9090/iepgm/services/dataSyncService</outboundurl>
                                </outbound>
                        </endpoint>
修改完毕,按“Esc”键后保存退出。
----结束
6.1.11    IEPGM海报无法显示问题
    现象描述
1、    在IEPGM系统中查看媒资详情无海报显示。
    原因分析
可能是以下原因:
1、    原因一:该媒资没有海报。
2、    原因二:IEPGM海报的预览服务器配置不正确。
3、    原因三:海报的源文件不存在。
4、    原四四:rsync海报同步服务器没有启动。
5、    原因五:rsync客户端配置不正确。
    问题解决
1、    在IEPGM的“媒资库”查看是否存在该海报。
    如果IEPGM系统显示的是默认图片,说明该媒资没海报,则不存在iEPGM海报无法显示的问题。
    否则,则表示该媒资有海报信息,但iEPGM无法显示海报文件。
2、    在IEPGM中检查海报的预览服务器路径配置是否正确。
以root用户登录iEGPM系统所在服务器。
打开“iepgmConfig.xml”文件。
vi /usr/local/iepgm/iepgm-jetty/iepgm/conf/iepgmConfig.xml
按“i”键进入编辑状态后,检查蓝色字体是否为IEPGM的IP和端口路径。
如果不是,请根据实际情况修改为IEPGM的IP和端口路径。
        <publish>
                <context></context>
                <!-- 预览服务器Url -->
                <preViewServer>http://172.20.101.13:9090/</preViewServer>
                <!-- 预览首页 -->
                <indexPageURL>pages/index.html</indexPageURL>
                <!-- 预览服务器的磁盘物理地址 -->
<preViewServerHardiskPath>/home/iepgm/iepgm-jetty/webapps/iepg
                </preViewServerHardiskPath>
                <!-- 网站资源文件的磁盘物理地址 -->
<resourceHardiskPath>/home/iepgm/iepgm-jetty/webapps/iepg/pages/resource/
                </resourceHardiskPath>
                <!-- 待同步的文件夹地址 -->
                <sysPath>/home/iepgm/iepgm-jetty/sys</sysPath>
                <!-- 客户端预览仿真器exe文件磁盘物理地址 -->
<emluatorHardiskPath>D:/bm3000/demo.exe</emluatorHardiskPath>
        </publish>
修改完毕,按“Esc”后输入“:wq!”保存退出。
3、    检查海报的源文件是否存在。
在无法显示的海报图片中,右键单击“属性”。
在弹出的“属性”对话框中查看海报源文件的地址,如“http://172.20.101.13:9090/poster_root/movie_poster/2012/4/20/PAKG8675156873145361/poster/500x745/20120420153025679_0013.jpg”,
到该路径下,检查海报源文件是否存在。
4、    当海报源文件不存在时,请在安装rsync的服务器上海报同步服务器是否开启。
ps -ef|grep rsync
若未开启,请执行如下命令开启:
rsync -daemon
5、    如果以上方法仍不能解决问题,请检查rsync客户端配置是否正确。
----结束
6.1.12    IEPGM中同一个产品下有两条相同的媒资信息
    现象描述
1、    在IEPGM的“影片维护”和“栏目管理”页面,查看到同一个产品/商品下存在两条相同的媒资信息。
    原因分析
可能是以下原因:
1、    BMS主备机数据未实现同步。
    问题解决
1、    进入BMS系统,检查是否有很多媒资都有重复数据。
2、    如果是,请检查BMS主机、备机是否正确配置了同步服务功能。
登录BMS所在服务器。
打开“uif_sync_config.xml”文件。
vi /usr/local/bms/coship-bms/bms/conf/uif_config/uif-sync-config.xml
请参见如下描述查看sync_data的值是否配置正确。
sync_data表示是否开启同步服务,true:开启、false:关闭。同级别,仅有一台BMS运行时,配置为true即可;同级别,有多台BMS运行时,只能配置其中的一台为true,其他的配置为false。
BMS热备时,请将主BMS配置成true;备BMS配置成false。
<config>
        <uif>
                <sync>
        <!-- 是否需要同步,作为同步客户端设置为true,作为同步服务端设置为false -->
                        <configItem>
                                <name>sync_data</name>
                                <value>true</value>
                        </configItem>
……
                </sync>
        </uif>
</config>
配置完毕,按“Esc”键后输入“:wq!”保存退出。
----结束
6.1.13    IEPGM无法上架电视剧问题
    现象描述
1、    进入IEPGM的“栏目编辑”页面后,发现在某些商品栏目下无法找到电视剧的媒资上架。
    原因分析
可能是以下原因:
1、    商品栏目的“关联影片类型”不是“全部”或“电视剧”。
    问题解决
1、    进入IEPGM的“栏目编辑”页面。
在左边的栏目列表中,单击选中栏目后,可在右边的“栏目信息”中查看“关联影片类型”是否为全部或“电视剧”(关联影片类型包括:全部、电视剧、电影),只有“关联影片类型”为“全部”或“电视剧”的栏目才能查找到电视剧的媒资。
如果不是,可新建一个“关联影片类型”为“全部”或“电视剧”的栏目即可。
----结束

6.1.14    认证失败
    现象描述
1、    进入机顶盒后,进行列表或点播,提示“请插入有效智能卡;或无效智能卡”等信息。
    原因分析
可能是以下原因:
1、    原因一:插入无效智能卡。
2、    原因二:智能卡没有开户。
3、    原因三:网络是否正常
4、    原因四:时间同步服务器是否正常
5、    原因五:STB不发认证请求
    问题解决
1、    原因一的解决方法
    请检查机顶盒是否能正常读取到卡号。
如换一张新的智能卡,不出现该故障;说明原智能卡无效。
    在iEPG的INFO级别日志看能否打印卡号。
日志路径:/usr/local/iepg/iepg-jetty/iepg/log/info/app-info.log
打印信息如下:
[INFO][2012-04-19 17:30:32,592][utils.JAXBUtil][
========================com.coship.ngod.a7.navcheck.request.NavCheck======请求参数===================================
<?xml version='1.0' encoding="UTF-8"?>
<NavCheck deviceId="8760002541116165" client="8760002541116165"/>
]
    在iEPG服务端抓包。
tcpdump -i eth0 Portal 8080 -s 0 -vvv -w /tmp/a7.cap
其中eth0为管理网口,/tmp/a7.cap为保存路径,请根据实际情况修改。
2、    原因二的解决方法
请在BOSS或BOSS测试桩中开户。
3、    原因三的解决方法
    telnet到机顶盒。
telnet 192.168.1.5
    在机顶盒上ping一下IEPG服务器的IP地址,看能否ping通服务器。
如果未ping通,请检查机顶盒网络。
----结束
4、    原因四的解决方法
如果iEPG已经下发认证信息,但还是提示“请插入卡或无效智能卡”,请参见如下步骤检查时间同步服务器是否配置正常。
    检查时间同步服务器是否正常启动。
若未正常启动,请启动。
    时间同步服务器正常启动后,请检查iEPGM中配置的“NTP_SERVER”参数是否正确。
1、登录iepgm系统。
2、选择“系统管理 > IEPG参数管理”,进入“IEPG参数管理”页面。
3、找到参数“NTP_SERVER”后,单击“修改”将该参数修改为的时间同步服用器的IP地址。
----结束
5、    原因五的解决方法
请在机顶盒上的“自助服务 > 系统设置 > vod服务器”中配置iEPG服务器的IP地址和时间同步服务器的IP地址。
----结束
6.1.15    无IPQAM资源
    现象描述
1、    进入直播或VOD播放时,提示无IPQAM资源。
    原因分析
可能是以下原因:
1、    原因一:认证不成功。
2、    原因二:下发的频道信息不正常。
3、    原因三:同轴电缆接得不对,锁不到频。
    问题解决
1、    原因一的解决方法
若是认证不成功造成的下发频点信息失败,请参见“认证失败”章节。
2、    原因二的解决方法
若是频道信息配置错误,请在iEPGM系统中
1)    登录iEPGM系统。
2)    选择“系统管理 > 区域频点”,进入“区域频点”页面。
3)    请根据实际情况修改一个能正确锁频的频点或新增频点信息。
新增频道信息时,请注意选择“频点类型”为“业务分区播发频点”。
3、    原因三的解决方法
1)    请先检查频点信息配置是否正确,具体请参见“问题二的解决方法”。
用该频点在机顶盒上搜索频道。
2)    如不能接收到频道说明没有信号,表明该同轴电缆不可用,此时请正确连接同轴电缆。
----结束

6.1.16    播放时黑屏且无任何提示
    现象描述
1、    播放影片时,无任何提示。
    原因分析
可能是以下原因:
1、    IEPG中没有正确配置SM(MAP)的IP地址。
    问题解决
1、    先在iEPG的INFO级别日志中,查看rtsp是否能正常生成。
日志查看路径为:“/usr/local/iepg/iepg-jetty/iepg/log”。
日志信息如下所示,请检查各参数是否正确:
rtsp:rtsp://172.18.1.50:554/;purchaseToken=4E8DE7AFD7218574D2B73C253F9A7201;serverID=172.18.1.30:18080
参数说明:
    172.18.1.50:554表示SM(MAP)的IP地址和端口号。
    172.18.1.30:18080表示AAA的IP地址和端口号。
2、    如果步骤1中检查到SM(MAP)地址配置错误,请在iepgConfig.xml里配置SM(MAP)地址。
以iepg用户登录服务器。
打开“iepgConfig.xml”文件。
vi /usr/local/iepg/iepg-jetty/iepg/conf/iepgConfig.xml
按“i”键进入编辑状态后,请将rtspServer修改为接收rtsp串的SM(MAP)的IP地址和端口号。
                <rtspServer>rtsp://172.20.11.22:554/</rtspServer>
按“Esc”键后,输入“:wq!”保存退出。
3、    如果步骤1中purchaseToken为空,请检查aaa是否在线。
如果在线,请查看aaa的debug日志,需要联系aaa开发人员支持。
4、    如果步骤1中配置的serverID错误,请在logdbcp.properties里正确配置的AAA服务器的IP地址和端口号。
1)    配置主AAA服务器的IP地址和端口号时,请先在“acf_config.xml”文件中配置AAA的代理和连接器信息。
路径:/usr/local/iepg/iepg-jetty/iepg/conf/uif/acf_config.xml
修改:AAA的代理和连接器信息。
                <agent>
                        <name>long_aaa1</name>
                        <isOpen>true</isOpen>
                        <agentImpl>ACFAgentImpl</agentImpl>
                        <routePolicy>ResidualHashPolicy</routePolicy>
                        <sendPolicy>PollSendPolicyForAgent</sendPolicy>
                        <connector>long_aaa1</connector>
                </agent>
                <agent>
                        <name>long_aaa2</name>
                        <isOpen>true</isOpen>
                        <agentImpl>ACFAgentImpl</agentImpl>
                        <routePolicy>ResidualHashPolicy</routePolicy>
                        <sendPolicy>PollSendPolicyForAgent</sendPolicy>
                        <connector>long_aaa2</connector>
                </agent>

<connectorMap>
                        <connector>
                                <name>long_aaa1</name>
                                <routePolicy>ResidualHashPolicy</routePolicy>
                                <sendPolicy>MinaPollSendPolicyForConnector</sendPolicy>
                                <address>${aaa1.Ip}</address>
                                <timeOut>30</timeOut>
                                <channelCount>200</channelCount>
                                <port>${aaa1.portLong}</port>
                                <reConnectTimes>3</reConnectTimes>
                        </connector>
                        <connector>
                                <name>long_aaa2</name>
                                <routePolicy>ResidualHashPolicy</routePolicy>
                                <sendPolicy>MinaPollSendPolicyForConnector</sendPolicy>
                                <address>${aaa2.Ip}</address>
                                <timeOut>30</timeOut>
                                <channelCount>200</channelCount>
                                <port>${aaa2.portLong}</port>
                                <reConnectTimes>3</reConnectTimes>
                        </connector>
2)    配置AAA服务器的IP地址和端口号。
路径:/usr/local/iepgm/iepg-jetty/iepg/conf/logdbcp.properties
修改:AAA的IP地址和端口号
#iEPG\u53C2\u6570\u914D\u7F6E
#AAA \u5730\u5740
aaa1.Ip=172.21.11.79
aaa1.portShort=18080
aaa1.portLong=18088

aaa2.Ip=172.21.11.79
aaa2.portShort=18080
aaa2.portLong=18088

aaa.bak.Ip=172.21.11.79
aaa.bak.portShort=18080
aaa.bak.portLong=18088
----结束
6.1.17    播放时提示无权限
    现象描述
1、    播放时提示无权限
    原因分析
可能是以下原因:
1、    AAA配置不正确,鉴权不成功
    问题解决
1、    配置AAA的代理和连接器信息。
配置主AAA服务器的IP地址和端口号时,请先在“acf_config.xml”文件中配置AAA的代理和连接器信息。
路径:/usr/local/iepg/iepg-jetty/iepg/conf/uif/acf_config.xml
修改:AAA的代理和连接器信息
                <agent>
                        <name>long_aaa1</name>
                        <isOpen>true</isOpen>
                        <agentImpl>ACFAgentImpl</agentImpl>
                        <routePolicy>ResidualHashPolicy</routePolicy>
                        <sendPolicy>PollSendPolicyForAgent</sendPolicy>
                        <connector>long_aaa1</connector>
                </agent>
                <agent>
                        <name>long_aaa2</name>
                        <isOpen>true</isOpen>
                        <agentImpl>ACFAgentImpl</agentImpl>
                        <routePolicy>ResidualHashPolicy</routePolicy>
                        <sendPolicy>PollSendPolicyForAgent</sendPolicy>
                        <connector>long_aaa2</connector>
                </agent>

<connectorMap>
                        <connector>
                                <name>long_aaa1</name>
                                <routePolicy>ResidualHashPolicy</routePolicy>
                                <sendPolicy>MinaPollSendPolicyForConnector</sendPolicy>
                                <address>${aaa1.Ip}</address>
                                <timeOut>30</timeOut>
                                <channelCount>200</channelCount>
                                <port>${aaa1.portLong}</port>
                                <reConnectTimes>3</reConnectTimes>
                        </connector>
                        <connector>
                                <name>long_aaa2</name>
                                <routePolicy>ResidualHashPolicy</routePolicy>
                                <sendPolicy>MinaPollSendPolicyForConnector</sendPolicy>
                                <address>${aaa2.Ip}</address>
                                <timeOut>30</timeOut>
                                <channelCount>200</channelCount>
                                <port>${aaa2.portLong}</port>
                                <reConnectTimes>3</reConnectTimes>
                        </connector>
配置AAA服务器的IP地址和端口号。
在logdbcp.properties里正确配置的AAA服务器的IP地址和端口号。
路径:/usr/local/iepgm/iepg-jetty/iepg/conf/logdbcp.properties
修改:AAA的IP地址和端口号
#iEPG\u53C2\u6570\u914D\u7F6E
#AAA \u5730\u5740
aaa1.Ip=172.21.11.79
aaa1.portShort=18080
aaa1.portLong=18088

aaa2.Ip=172.21.11.79
aaa2.portShort=18080
aaa2.portLong=18088

aaa.bak.Ip=172.21.11.79
aaa.bak.portShort=18080
aaa.bak.portLong=18088
----结束
6.1.18    时移标识不出来
    现象描述
1、    开机后,能进入直播频道,但不能进行时移。
    原因分析
可能是以下原因:
1、    原因一:时移频道及节目单未同步到iEPG。
2、    原因二:该频道不支持时移,或未订购。
3、    原因三:认证未通过。
4、    原因四:频道的“tsId”和“serviceId”与局方提供的“节目id”和“流id”不一致。
    问题解决
1、    原因一的解决方法
请在BMS中新建对应的频道、产品和商品。
2、    原因二的解决方法
检查产品是否支持时移的能力。
请在BMS系统的“产品管理 > 产品维护 > 查看产品”页面,检查产品的“提供服务”是否支持时移。
如果不支持,请新增产品,新增产品时,请将“提供服务”设置为“时移”。
新增产品后,请将产品打包成商品,打包商品时,请将“订购方式”设置为“包月订购”。
检查产品对应的商品是否已经订购。
在机顶盒上点播该商品,如果提示未订购,请先订购。
    有boss或sms环境:在boss或sms环境中订购即可。
    无boss或sms环境:可通过“HTTP+Xml Test Tool”等工具模拟订购。
----结束
3、    原因三的解决方法
认证不通过时,不会下发频道列表的,所以一定不会有时移标识,此时请参见“认证失败”章节进行问题定位。
4、    原因四的解决方法
当认证已通过,频道已下发,还没有时移标识时,请参见如下步骤操作:
请检查频道的“TSID”和“ServiceID”是否与局方提供的“节目id”和“流id”一致。
可采用如下两种方法查看:
    在BMS系统的“资源管理 > 频道管理 > 频道详情”的页面,查看频道的“TSID”和“ServiceID”
    进入直播频道时,按摇控器上的“红键”,会弹出频道信息。
如果频道的“TSID”和“ServiceID”与局方提供的“节目id”和“流id”不一致,请联系局方获取一个正确的直播频道的频点信息表。
----结束
6.1.19    IEPGM后台数据变更了iEPG没有展示
    现象描述
1、    在iepgm后台变更了上下架或栏目数据,没有在iepg展示。
    原因分析
可能是以下原因:
1、    iEPG有缓存刷新机制,默认为30分钟做检查更新。
    问题解决
1、    如果是测试阶段,可以缓存刷新60000即1分钟;正式商用时,建议改为180000即30分钟。
    路径:/usr/local/iepg/iepg-jetty/webapps/iepg/WEB-INF/web.xml
    请根据实际情况修改蓝色字体标识的参数:
 <param-name>CacheRefreshInterval</param-name>
                <param-value>180000</param-value>

6.1.20    无频道回看节目单
    现象描述
1、    在机顶盒中不显示任何频道及节目单。
    原因分析
可能是以下原因:
1、    原因一:在BMS在不存在频道及节目单。
2、    原因二:频道及节目单未同步到iEPGM数据库。
    问题解决
1、    原因一的解决方法
在BMS中检查是否存在频道及节目单;如果不存在,请参见如下步骤操作:
1)    新增频道。
2)    审核频道。
3)    导入节目单。
4)    新增产品。
5)    审核产品。
6)    新增商品。
7)    审核商品。
2、    原因二的解决方法
在BMS系统的“系统管理 > 同步管理”页面中看到是否有同步失败的“iepgXXXXX”消息。
    如果存在,请参见如下步骤检查BMS中配置的iEPGM的地址是否正确。
1)    登录BMS所在服务器。
2)    打开“uif-sys-address-config.xml”文件。
vi /usr/local/bms/coship-bms/bms/conf/uif_config/uif-sys-address-config.xml
3)    检查BMS中配置的iEPGM的IP地址和端口号是否正确。
如果不正确,请按“i”键进入编辑状态后,修改蓝色字体为iEPGM的IP地址和端口号。
                        <!-- 同步给IEPG的同步配置文件 -->
                        <endpoint>
                                <name>iepg</name>
                                <inbound>
<inboundname>iepg.inbound.endpoint</inboundname>
                                        <inboundurl>iepg_inbound</inboundurl>
</inbound>
                                <outbound>
<outboundname>iepg.outbound.endpoint</outboundname>
                        <!-- iEPGM的IP地址和端口号-->
<outboundurl>http://172.20.101.13:9090/iepgm/services/dataSyncService</outboundurl>
                                </outbound>
                        </endpoint>
4)    按“Esc”键后输入“:wq!”保存退出。
    如果不存在同步失败消息,需检查iEPGM数据库中频道、节目单是否存在及可用,存在的标准是能搜索出相关数据,可用的标准是status的值是否为1,具体内容请参见数据库文档。
select * from t_iepg_channel t;
select * from t_iepg_program_guide t;
----结束

6.1.21    电视剧(包月)子集列表都为1
    现象描述
1、    包月的电视剧,剧集列表展示的集数都为1。
2、    在BMS系统的“资源管理 > 资源包管理 > 资源维护”下,各子资源的集序号都为1或未按对应集数显示。
    原因分析
可能是以下原因:
1、    在BMS注入电视剧子集媒资文件时,应手工指定子集集数。
    问题解决
1、    在BMS的“媒资编辑”中修改对应媒资文件的“集数”字段的值与实际一致。

6.1.22    电视剧(按次)子集列表排序混乱
    现象描述
1、    按次的电视剧,剧集列表展示无顺序。
2、    在BMS中的“资源管理 > 资源包管理 > 资源维护”下,各子资源的集序号都为1或未按对应集数显示。
    原因分析
可能是以下原因:
1、    BMS注入电视剧子集媒资文件时,应手工指定子集集数,
    问题解决
1、    在BMS的“媒资编辑”中修改对应的媒资文件的“集数”字段的值。

6.1.23    BMS页面显示异常
    现象描述
1、    进入BMS系统,单击菜单链接(如资源管理 > 媒资管理,产品管理 > 产品维护等),进入相应页面时,页面显示异常。
    原因分析
可能是以下原因:
1、    原因一:启动用户不是root。
2、    原因二:BMS启动用户没有拥有对coship-bms/work/目录的所有权限。
    问题解决
1、    原因一的解决方法
检查启动用户是否为root。
ps -ef|grep java
    如果系统显示如下所示信息,说明启动用户为root,其中第一列表示启动用户。
root     11770     1 19 17:41 pts/2    00:00:30 /usr/java/jdk1.6.0_26/bin/java -DSTOP.PORT=8079 -DSTOP.KEY=bmssys -jar start.jar
    否则,表示启动用户为其他用户,此时,请参见如下描述操作:
用当前目录停止BMS系统。
cd /usr/local/bms/coship-bms
./stopJetty.sh
切换到root用户。
su -root
用root用户启动BMS系统。
cd /usr/local/bms/coship-bms
./startJetty.sh
2、    原因二的解决方法
检查启动用户是否拥有对coship-bms/work/目录的所有权限,确保BMS启动用户拥有该目录的全部权限。
如果以上方法仍无法解决问题,请联系BMS的开发人员。
----结束
6.1.24    媒资注入失败
    现象描述
1、    ADI导入成功,但在BMS系统中查看影片资源的“注入状态”为“注入失败”。
    原因分析
可能是以下原因:
1、    原因一:资源文件(ts文件)的文件路径错误。
媒资的FTP存放路径配置错误,导致Uproxy下载媒资内容(.ts)到本地服务器时失败,进而导致媒资注入失败。
2、    原因二:TS文件码率不是系统支持的码率。
视频文件格式不规范引起的注入失败,有可能是码率波动太大,导致生成索引文件或倍速文件失败,进而导致媒资注入失败。
    问题解决
1、    原因一的解决方法
在BMS系统的“影片资源详情”页面,查看媒资的“文件路径”是否正确。
    如果正确,操作结束。
    如果不正确,请参见如下步骤操作。
找到媒资相应的ADI文件,将“ftpurl”参数修改正确。
可手工在命令行登录ftp服务器测试一下ftpurl是否正确。
登录BMS系统,进入“资源管理 > 媒资编辑”页面找到相应媒资后,将其删除。
删除媒资后,请在一个小时后再重新导入修改后的ADI文件。
2、    原因二的解决方法
用视频检测工具(如泰克分析工具、Scivo码流分析仪或Elecard工具)来检测视频文件格式是否规范。
不符合规范时,请按照同洲规范重新编码视频文件,将其上传相应的ftp目录下。
登录BMS系统,进入“资源管理 > 媒资编辑”页面找到相应媒资后,将其删除。
删除媒资后,请在一个小时后再重新导入修改后的ADI文件。
----结束
6.1.25    产品关联资源时没有预关联的资源文件
    现象描述
1、    在产品关联资源页面,查询不到预关联的资源文件。
    原因分析
可能是以下原因:
1、    原因一:当前产品创建者不拥有媒资的授权关系,导致无法添加到产品上。
2、    原因二:资源文件没有审核。
    问题解决
1、    原因一的解决方法
由运营商管理员为当前产品创建者添加长期合作的CP伙伴;或由CP将媒资内容授权给当前产品创建者。
2、    原因二的解决方法
检查资源文件是否已审核;若未审核,请先审核后再关联。
----结束
6.1.26    资源已关联到产品,IEPGM未查询到该资源
    现象描述
1、    BMS系统已关联资源到产品,但IEPGM的“影片维护”页面未查询到该资源。
    原因分析
可能是以下原因:
1、    原因一:产品未审核。
2、    原因二:同步表(t_messagesync)中的同步消息还未同步。
3、    原因三:同步历史表(t_messagesync_his)中的同步消息还未同步。
    问题解决
1、    原因一的解决方法
1)    在BMS系统的“资源管理 > 媒资检索”页面检查产品是否被审核。
若未审核,请以运营商管理员用户登录BMS系统的“资源管理 > 媒资审核”页面审核媒资。
2)    检查该资源是否被打包成产品。
    如果未被打包成产品,请在BMS系统的“产品维护”页面,新增产品并将资源添加进去。
    打包产品后,请在BMS系统的“产品审核”页面审核产品。
3)    如果资源已被打包成产品,请检查该产品是否有打包商品。
    如果未被打包成商品,则在BMS系统的“商品管理”页面,新增商品并打包包含该资源的产品。
    打包商品后,请在BMS系统的“商品审核”页面审核商品。
2、    原因二的解决方法
检查同步表(t_messagesync)还未同步;如果长时间没有同步,重启BMS系统。
3、    原因三的解决方法
检查同步历史表(t_messagesync_his),是否未成功同步。
----结束
6.1.27    BMS海报无法显示问题
    现象描述
1、    在BMS系统中查看媒资详情无海报显示。
    原因分析
可能是以下原因:
1、    原因一:BMS中该媒资没有海报。
2、    原因二:BMS海报的FTP服务器路径配置不正确。
3、    原因三:BMS海报的路径下已不存在此海报。
4、    原因四:rsync服务端没有开启。
5、    原因五:rsync客户端配置不正确。
    问题解决
1、    在BMS系统的“影片资源详情”页面,检查该媒资是否有海报,如果没有则添加海报。
如果BMS系统不是显示的默认图片,则表示该媒资有海报信息,但无法取到显示海报文件。
2、    检查BMS中配置的的海报FTP服务器的路径是否正确。
1)    以root用户登录BMS所在服务器。
2)    打开“bms-config.xml”文件。
vi /usr/local/bms/coship-bms/bms/conf/bms-config.xml
3)    检查蓝色字体标志的海报服务器的路径是否正确。
其中ftper:pftper分别表示海报FTP用户名和密码;172.21.11.8:21分别海报FTP服务器IP的端口号;如果不正确,请根据实际情况修改。
                <!-- 海报FTP地址 -->
<poster-ftp>ftp://ftper:pftper@172.21.11.8:21/</poster-ftp>
4)    修改完毕,按“Esc”键后输入“:wq!”保存退出。
3、    检查海报的源文件是否存在。
1)    在无法显示的海报图片中,右键单击“属性”。
在弹出的“属性”对话框中查看海报源文件的地址,如“http://172.20.101.13:9090/poster_root/movie_poster/2012/4/20/PAKG8675156873145361/poster/500x745/20120420153025679_0013.jpg”,
2)    到该路径下,检查海报源文件是否存在。
4、    当海报源文件不存在时,请在安装rsync的服务器上海报同步服务器是否开启。
ps -ef|grep rsync
若未开启,请执行如下命令开启:
rsync -daemon
5、    如果以上方法仍不能解决问题,请检查rsync客户端配置是否正确。
----结束
6.1.28    资源包关联媒资时查询不到资源
    现象描述
1、    在新建资源包后关联媒资时,查询不到相关资源。
    原因分析
可能是以下原因:
1、    原因一:资源信息没有导入到BMS系统。
2、    原因二:资源没有注入完成并审核。
3、    原因三:创建资源包的人没有使用媒资的权限。
    问题解决
1、    在BMS系统中检查资源信息(ADI文件)是否已导入到BMS系统。
1)    在BMS系统中选择“资源管理 > 媒资检索”,进入“媒资检索”页面。
2)    在“媒资检索”页面的“查询”框中,输入查询条件检查相关媒资信息是否已导入到BMS系统中。
如果未导入,请导入;否则,请参见如下步骤操作。
2、    检查资源是否已注入完成并审核。
1)    在“媒资检索”页面查看媒资的“状态”是否为商用。
如果是商用,说明资源已注入完成并审核通过,本步骤结束;否则,请参见如下步骤操作。
2)    媒资“状态”为“新增待审核”时,请在“操作”列中单击“影片资源”,进入“影片资源检索”页面查看“注入状态”。
    如果“注入状态”为“注入完成”,请进入“资源管理 > 媒资编辑”页面审核媒资。
    如果“注入状态”为“注入失败”,请参见“媒资注入失败”章节操作。
3、    检查创建资源包的人是否有使用媒资的权限。
若没有,由运营商管理员为其添加长期合作的CP伙伴;或由CP将媒资内容授权给创建资源包的SP。
----结束
6.1.29    CP或SP修改信息时报错
    现象描述
1、    把“编辑SP信息”的权限赋给CP或把“编辑CP信息”的权限赋给SP时,页面会报错。
    原因分析
可能是以下原因:
1、    当初系统设计时,没有对SP和CP的最大权限进行控制,管理员可以分配CP拥有所有的权限,如修改SP的权限等情况。
    问题解决
1、    运营商管理员在分配SP和CP权限时,需要对SP和CP角色的权限进行控制。去掉CP拥有对SP的权限或SP拥有CP的权限。具体分配如下:
    SP超级管理员:
−    权限管理。
−    产品管理。
−    商品管理
−    “合作伙伴管理 > SP资料维护”下的“编辑SP资料”权限。
    SP其它角色:
−    产品管理。
−    商品管理
−    “合作伙伴管理 > SP资料维护”下的“编辑SP资料”权限。
    CP超级管理员:
−    权限管理。
−    资源管理。
−    “合作伙伴管理 > CP资料维护”下的“编辑CP资料”权限。
    CP其它角色:
−    资源管理。
−    “合作伙伴管理 > CP资料维护”下的“编辑CP资料”权限。
----结束
6.1.30    导入节目单失败
    现象描述
1、    导入节目单失败,界面显示如0所示:

    打开“/usr/local/coship-bms/bms/log/error/app-error.log”文件,可查看到如下日志信息:
    at org.springframework.jdbc.support.SQLErrorCodeSQLExceptionTranslator.doTranslate(SQLErrorCodeSQLExceptionTranslator.java:248)
    at org.springframework.jdbc.support.AbstractFallbackSQLExceptionTranslator.translate(AbstractFallbackSQLExceptionTranslator.java:72)
    at org.springframework.orm.ibatis.SqlMapClientTemplate.execute(SqlMapClientTemplate.java:212)
    at org.springframework.orm.ibatis.SqlMapClientTemplate.update(SqlMapClientTemplate.java:411)
    at com.coship.dhm.core.dao.resource.impl.ProgramDaoImpl.update(ProgramDaoImpl.java:115)
    at sun.reflect.GeneratedMethodAccessor1745.invoke(Unknown Source)
    …...
    ……
Caused by: com.ibatis.common.jdbc.exception.NestedSQLException:   
--- The error occurred in com/coship/dhm/core/dao/resource/impl/oracle/maps/Program.xml.  
--- The error occurred while applying a parameter map.  
--- Check the updateProgram-InlineParameterMap.  
--- Check the statement (update failed).  
--- Cause: java.sql.SQLException: ORA-00060: 等待资源时检测到死锁

    原因分析
可能是以下原因:
1、    深层原因仍在调查中,有可能是其他资源占用了数据库连接没有及时释放,导致节目单导入失败。
    问题解决
1、    可采用暂时规避方法:在不影响业务运行的情况下重启BMS服务。

6.2    CDN常见故障处理

6.2.1    日常故障处理:
接收运营日报,联系总集成,定位并确认问题,同时联系相应功能模块的厂商,输出报告。
6.2.2    紧急故障处理:
在VSS支持relocate功能的情况下,CG组或Cache单机故障时最终用户点流业务无感知,VSS应在已建流不断的情况下,向VSS中设置的备份Cache组拉流。由于当前VSS还不支持relocate功能,单台Cache故障将导致已建流中断,但不影响后继的新建点播流,为了保障快速的完成切换,一旦发生紧急故障,需要立即联系影莅弛或思华VSS技术人员,要求其确认VSS已成功切换为向备用Cache组拉流,在业务恢复正常后,由思科对系统进行故障诊断及恢复。

6.3    PORTAL常见故障处理
6.3.1    STB不能访问Portal    
第一步:查看网络终端是否正常
通过PC接入到终端网络,然后对Portal服务器进行ping操作或从别的服务器上对Portal服务进行ping操作,以此验证到Portal服务的网络是否正常。
第二步:查看Portal服务是否运行
如果网络正常而STB不能访问到Portal需进行此步骤的验证,其具体操作如下:打开IE,在地址输入栏中输入http://ip,如能进入Portal页面则表示Portal服务启动正常,否则需进入下一步确认。如果通过IE访问不能确定,将要登录到服务器上,通过ps -ef | grep nginx查看Portal_F是否已经启动,如果出现如下信息表示成功启动,否则为Portal服务未启动。
 
第三步:启动Portal服务:
   执行如下命令进入服务启动路径
 
   然后执行如下命令启动服务

6.3.2    Portal页面能进入,但VOD节目、栏目信息不能显示
第一步:检测BO是否能正常访问
打开IE,在地址输入栏中输入http://ip/index.jsp进入如下测试页面:
 
在上述测试页面中,点击“获取一级栏目信息【OK】”,验证页面是否能正常打开并返回类似如下数据:
<?xml version="1.0" encoding="UTF-8" ?>
<RootContents totalResults="21"currentResults="21" restartAtToken="{prePage:1,nextPage:1,totalCount:21,pageNo:1,pageSize:100,totalPages:1}" >
<ChildFolder  assetId="1" parentAssetld="" displayName="推荐区" displayFlags="" infoText="" folderType="0" orderNumber="" format="" >
<Image  posterUrl="" rank="1" />
 </ChildFolder>
</RootContents>
如果通过上述方法不能访问到数据,需登录到Portal服务器上对问题进一步进行分析:
登录到Portal服务器上对BO服务进行检查访问是否正常,执行如下命令:
telnet  ip地址  端口号
如果通过此步骤检查BO访问正常,将进行下一步的问题确定

第二步:检查Portal_B服务模块是否启动
登录到Portal服务器上,执行如下命令:
ps -ef | grep tomcat
检查是否能显示如下内容
root     16107     1  0 14:20 ?        00:01:06 ../../jdk1.6.0_30/bin/java -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=1090 -Dcom.sun.management.jmxremote.ssl=false -Dcom.sun.management.jmxremote.authenticate=false -Xms1024m -Xmx1024m -XX:PermSize=512m -XX:MaxPermSize=512m -Djava.util.logging.manager=org.apache.juli.ClassLoaderLogManager -Djava.util.logging.config.file=/home/ngod/service/Portal_B/bin/apache-tomcat-6.0.16/conf/logging.properties -Djava.endorsed.dirs=/home/ngod/service/Portal_B
第三步:启动Portal_B
如果是发现Portal_B未启来,需执行如下命令对服务进行启动:
登录到Portal服务器上进入/home/ngod/service/Portal_B/bin目录,执行./startTomcat.sh对服务进行启动。

6.3.3    页面出现“请求失败”提示
第一步:查看Portal_B日志
进入/home/ngod/service/Portal_B/logs目录下实现如下命令对日志文件进行打开
# tail -f  Portal_B.log
第二步:对日志进行分析
      为了分析到问题的日志,需一边使用STB对问题进行重新复现,一边查看日志是否有报错,如有问题将报如下日志进行:
 
如果出现如上截图现象表明为BO连接不上,这时需检查BO是否正常。

6.4    VSS常见故障处理
遇到故障时基本分析流程
 
点播流程是图(2)中的1-2-3-4-5-6的顺序的。当遇到点播问题的时候,主要就是分析这6个步骤是否都正常。
图(1)中主要是各部件通信涉及协议。

6.4.1    一按快进快退就提示播放结束的原因
1、    可能是片源问题,导致CDN没有生成相应正确的倍数文件。叫CDN相关人员定位。如果是影片问题,及时下架处理。
2、    如果确认片源是好的,CDN也生成了相应正确的相应的倍数文件,那可能是由于这部影片对应的媒资ID被用过,推流服务器把该索引文件缓存下来了导致的。只要把推流服务器对应的索引文件删除即可。
3、    如果在以上都没有解决,那再叫CDN的相关人员查看下他们的缓存,是否更新了最新的索引文件。
4、    暂时遇到的这种问题都是通过以上三个步骤就可以定位解决了,如果发现问题通过以上步骤还未解决,请联系推流服务器相关维护人员定位。

6.4.2    用户点播失败问题

1、    根据《Portal消息框提示列表-2012.7.24修正》中错误码,跟电视机提示错误码对照。看是否跟推流服务器相关。
2、    如果是跟VSS相关的,则查看VSS服务是否正常。可以用:telnet IP:554来查看该服务是否已经起来。
3、    如果提示信息涉及跟机顶盒没有收到数据流相关,则登录推流服务器,使用:sar –n DEV 2来查看网卡是否有流量。
4、    如果需要验证数据是否正常,则可以用:tcpdump –i网口名字–s 0 –w 保持路径以及数据包名字–vv,把数据包抓取下来分析。
5、    如果推流服务器有流,但是机顶盒还是提示没有收到数据,请检查IPQAM是否收到VS发送数据,并且查看IPQAM是否把数据正确的送出。
6、    如果还没有解决问题,请联系推流服务器相关维护人员定位分析。

异构平台运维工作文档相关推荐

  1. 监控服务器项目报备,智慧环保监控预警平台运维项目

    #县域政务信息化 智慧环保监控预警平台运维项目 一.运维服务内容 对区智慧环保监控预警平台进行运营维护工作,保障企业端设备及系统正常运行,将企业端数据上传至智慧环保监控预警平台. 运维服务期限:一年. ...

  2. 云平台运维的一些心得

    现在云计算时代,越来越多企业将业务搬到云上了,很多做运维的同胞们,或多或少都会接触过云平台. 相比传统运维,很多一些日常操作只需要点点按钮就搞定了,一下子运维工作就变得简单了很多. 所以问题来了,云平 ...

  3. 部分大数据平台运维题及答案

    大数据平台运维 HDFS题: 1.在HDFS文件系统的根目录下创建递归目录"1daoyun/file",将附件中的BigDataSkills.txt文件,上传到1daoyun/fi ...

  4. IT运维工单高效协同,助力打造一站式运维方案

    随着经济全球化的发展趋势,信息系统在企业运营中占据着愈发重要的位置.业务系统越来越多,用户对信息系统的依赖性越来越强,关键业务系统的中断都将导致企业业务.服务的中断,极大的影响了企业业务稳定运行和持续 ...

  5. 1+X云计算平台运维与开发认证(中级)样卷E-过程与答案

    相关内容: 1+X云计算平台运维与开发认证(中级)样卷A-过程与答案 1+X云计算平台运维与开发认证(中级)样卷B-过程与答案 1+X云计算平台运维与开发认证(中级)样卷C-过程与答案 1+X云计算平 ...

  6. 1+X云计算平台运维与开发认证(中级)样卷D-过程与答案

    相关内容: 1+X云计算平台运维与开发认证(中级)样卷A-过程与答案 1+X云计算平台运维与开发认证(中级)样卷B-过程与答案 1+X云计算平台运维与开发认证(中级)样卷C-过程与答案 1+X云计算平 ...

  7. 1+X云计算平台运维与开发认证(中级)样卷C-实操过程

    相关内容: 1+X云计算平台运维与开发认证(中级)样卷A-过程与答案 1+X云计算平台运维与开发认证(中级)样卷B-过程与答案 1+X云计算平台运维与开发认证(中级)样卷C-过程与答案 1+X云计算平 ...

  8. 游戏平台运维自动化扩展之故障自愈

    马辰龙,负责某大型网页游戏平台的运维开发,专注于运维自动化.监控系统故障自愈研究,擅长Perl开发.正则表达式.日志精确匹配. 网络游戏是对用户体验要求最严苛的IT行业之一,任何IT问题造成的业务不稳 ...

  9. 1+X云计算平台运维与开发认证(初级)样卷D

    1+X云计算平台运维与开发认证(初级)样卷D

最新文章

  1. 在sublime中让html和css链接
  2. 十八、“问余浪子今何在,唯有回头铸梦人”(2021.5.28)
  3. C盘突然爆满怎么办?
  4. android 去锯齿
  5. TensorFlow是什么?TensorFlow入门与实践 架构与设计详解
  6. 华为HCNE专题一:网络基础知识
  7. 如何访问Server 2008R2的共享不输入密码
  8. 使用ldconfig命令将/usr/local/lib加入到默认库
  9. 王石先生深奥的脑筋急转弯
  10. win10安装马上6卡在icon.ico的一种解决方案
  11. atmega328 48手动解锁 擦除
  12. 华为p4不是鸿蒙吗怎么又改为安卓_鸿蒙系统是不是就是改版的安卓系统?
  13. Comsumer的一些解释
  14. iOS7到iOS8 一个通用的横竖屏幕切换总结
  15. shell 变量五 字符串掐头去尾
  16. Nette框架:第一印象
  17. 旅游自助系统之后台管理系统设计
  18. 用UltraISO制作镜像以RAW格式写入到U盘后,无法识别的解决办法
  19. osi是什么?计算机有哪几层?每一层有什么作用?
  20. 【EMC专题】电磁辐射的危害

热门文章

  1. 导出百度网盘共享文件库目录清单的脚本
  2. awx,micaps,hdf,nc,radar,多普勒雷达,grib等各种数据解析,出图,计算等,有需要,欢迎联系.
  3. linux shell 判断一个文件是不是链接文件
  4. 计算机学报杂志官网在线出版,计算机学报
  5. js 拖曳功能--代码解析
  6. rs485数据线接反_数据信号TXD、RXD 发送和接受怎么区分正负极呢? 现在数据信号TXD、RXD需接RS485+ RS485-信号该怎么接呢...
  7. 智能社JS学习笔记(一)
  8. 自然语言处理菜鸟学习笔记(一)
  9. 论文阅读笔记《USAC: A Universal Framework for Random Sample Consensus》
  10. 教你如何一键下载汽车之家作者的所有无水印视频