pyspider 分布式爬虫部署

背景介绍 pyspider的架构主要分为 scheduler(调度器), fetcher(抓取器), processor(脚本执行), 如下图所示: 整个 pyspider 的各个模块间的任务传递是由消息队列传输的,其中任务的调度则是由「scheduler」模块控制,所以按作者的意思,除了「scheduler」调度模块只能单点,其他的「fetcher」,「processor」,甚至是「monitor & webui」,都可以实现多实例分布式部署。 分布式爬虫部署 准备工作 # 新建工作路径 mkdir pyspider cd

Ghost 自定义

评论 前些年多说几乎遍布每个个人网站,但随着多说和网易云跟帖的倒台,其他的替代品,如畅言(需备案)、Dispus(需翻墙)、来比力等 Dispus https://help.ghost.org/hc/en-us/articles/115000440851-Disqus 来比力 livere.com 进入来比力官网首页,点击导航栏上的安装,选择City版(适合个人的免费版本),点击现在安装,提示需要登录(没账号先用邮箱注册)。 然后输入网站的基本信息即可生成代码。把代码插入你的网页适当的位置即可,登录来比力官网可以进入你的管理后台查看和管理评论数据。 站点统计 Injecting

ubuntu添加新用户并设置root权限

一,添加用户 ubuntu建用户最好用adduser,虽然adduser和useradd是一样的在别的Linux糸统下,但是我在ubuntu下用useradd时,并没有创建同名的用户主目录。 例子:adduser user1。这样就会自动创建用户主目录,创建用户同名的组。 root@ubuntu:~# sudo adduser db [sudo] password for xx: 输入xx用户的密码,出现如下信息 正在添加用户"db"… 正在添加新组"db" (1006)… 正在添加新用户"

位置预测:数据预处理、数据清洗

从mongodb导出数据 ssh ansi.space mongoexport -d WZYC -c locations -o locations.json scp as@ansi.space:~/locations.json . 数据以用户(uuid)分类处理 数据以用户(uuid)分类处理,并打印输出每个用户的数据信息 去除异常点 去除用户定位位置变动离奇、不符合常理的点 算法自动寻找常住位置 寻找所在区域花时间较多:寻找出家和工作地点 频繁项集 《机器学习实战》

ssh正向连接、反向连接、做socks代理

1、用ssh做正向连接 啥叫正向连接?就是client连上server,然后把server能访问的机器地址和端口(当然也包括server自己)镜像到client的端口上。 命令: ssh -L [客户端IP或省略]:[客户端端口]:[服务器侧能访问的IP]:[服务器侧能访问的IP的端口] [登陆服务器的用户名@服务器IP] -p [服务器ssh服务端口(默认22)] 其中,客户端IP可以省略,省略的话就是127.0.0.1了,也就是说只能在客户端本地访问。服务器IP都可以用域名来代替。 举例说明: 你的IP是192.168.1.2,你可以ssh到某台服务器8.

ionic

ionic 刷新界面的几种方式

reload 方法 该方法强迫浏览器刷新当前页面。 语法:location.reload([bForceGet]) 参数: bForceGet, 可选参数, 默认为 false,从客户端缓存里取当前页。true, 则以 GET 方式,从服务端取最新的页面, 相当于客户端点击 F5("刷新") replace 方法 该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,你不能通过“前进”和“后退”

博士论文研究的选题、开题中需要注意的问题

关于论文研究内容的选择 博士论文研究是针对特定领域的未解决问题的研究,通过研究提出和验证解决这个问题的新理论新方法新模式。论文的创新性贡献一定是解决别人还没有解决、或者在某些方面解决得不好的问题。 因此,学生在文献综述分析的基础上必须首先回答:在这个领域,存在哪些没有解决的关键问题、这些问题目前的主要解决思路是什么、有什么人利用什么方法与技术正在解决这些问题、已经达到或近期预计能够达到的解决程度怎样、它们在解决这些问题时还存在什么重大缺陷。学生应该从这些“缺陷”中发现里面体现着或隐藏着的重要科学问题。 接着,学生必须着重回答:按照前面分析,打算针对哪些或哪个“缺陷”和它(它们)所代表的科学问题进行研究,这实际上就构成论文的具体研究问题。所谓选题、定题、开题,都要落实为这个具体研究问题。然后,学生要说明解决这个问题的意义(即“研究意义”