当前位置:首页 > 天道酬勤 > 正文内容

毕业设计管理系统需求规格说明书(学生成绩管理系统软件需求说明书)

张世龙2021年12月20日 03:57天道酬勤1350

我不知道为什么突然想注册头条号,也不知道第一篇文章在发什么。 没有很强的专业领域。 最近在做公司的爬虫管理系统,这个项目必须通过CMMI的认证。 简单地写一下吧。

迄今为止,我体验过神采和八爪鱼等许多爬虫系统,各有特点,公司主要进行民意调查。 因此,需要各种网站,几乎所有的新闻类爬虫。 另外,还需要根据内容的发布时间进行筛选,随时监视爬虫系统的运行状况。 这部分是需求分析吧。

产品功能框架

1.1创建目的

1 .本书是爬虫管理系统的需求分析说明书,供设计者使用,作为系统设计的依据。 产品经理跟进产品执行程度的依据。 了解或执行外部人员产品的依据。

2 .作为项目的检验标准之一。

3 .软件维护参考资料。

1.2文档范围

本书是项目的软件要求规格书和技术文件。

本文档的使用对象如下。

l项目用户

l项目经理

l软件工程集团

l与软件相关的组成员

l用户

未经项目负责人书面许可,不得向上述规定对象以外的人阅读或使用本文件。

1.3术语的定义

缩略语、用语

说明

爬行动物

一种能够自动获取网页内容并根据指定规则提取适当内容的程序

处理程序

主要用于处理异步消息。 一条消息发送后,首先进入一个消息队列,发送消息的函数很快返回,另一部分从消息队列中一条条地提取消息,然后处理消息。 也就是说,发送和接收消息不是同步的过程。 这个机制通常用于处理比较耗时的操作。

分布式体系结构

分布式体系结构是的APP应用和工具,目前成熟的包括J2EE、CORBA、 net(DCOM )

舆论

舆论是“舆论状况”的简称,是在一定的社会空间内,围绕中介性社会事件的发生、发展、变化,作为主体的民众对客体的社会phddy、企业、个人、其他各类组织及其政治、社会、道德等方面的方向发生、持有这是广大群众对社会各种现象、问题所表达的信念、态度、意见、感情等表达的总和。

爬行动物的采集方式

收集方式主要分为记录和检索两部分,记录是网站的输入,可以手动找到需要输入的网站,按照产品流程进行任务制作,后期根据任务设定的更新时间,定期收集更新新闻内容。 检索方式是在人工找不到的情况下,通过扩展的关键词库,通过驻地检索和检索引擎进行检索,将检索到的内容分类,添加到对应的网站下。

很难解决的问题是,在很多网站上,文章的内容和字段不统一。 例如,作者、公开时间等。 需要先行调查,且搜狐、新浪等大型网站下板块非常多,各板块还相对独立,因此需要采用不同的采集方式。 有必要分别管理那个。

我们采用的解决方案是将各级域名作为一个项目,例如sohu.com作为一个项目,搜狐下的二级域名有很多,各级可以成为这个项目中的一个网站,系统可以当然这部分需要算法的介入。

列表页分页规则的解析过程

另一个需要考虑的问题是文章的分页符,普通网站有文章列表页。 只要找到列表页,监视列表页,就可以知道网站的文章是否会更新,抓住也是相对的全部。 但是,列表页可能有很多页,需要找到相应的分页按钮,但是在各个站点(如AJax和JSON )中分页的方法也不同。 必须将人工识别和识别的同一类型的采集方式应用于其他列表页。 这是人工机械的解决方案吧。

与其他任务相关的问题还有很多,但也有任务监视部分、任务创建和内容分析规则配置部分。 等以后想出来再补充吧。

本文为原创,未经许可禁止转载。

扫描二维码推送至手机访问。

版权声明:本文由花开半夏のブログ发布,如需转载请注明出处。

本文链接:https://www.zhangshilong.cn/work/25364.html

标签: 软件
分享给朋友:

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。