Monthly Archives: September 2009

转载:cnBeta与Google_Reader

很早就开始(04年?)上cnBeta看新闻。最近几年cnBeta的影响力提升速度十分惊人,侧边栏的评论也成了一大特色。不过随着影响力的提升,众多 nc,wt也渗入其评论之中,不堪其扰;每天新闻条目的数量上升速度也很快,逐个点击查看的方式渐渐也不堪重负。遂转移平台至Googel Reader,很好的解决了这个问题。

Posted in 其他 | Tagged | Leave a comment

html2bbcode: 把html文档转换为discuz代码

缘起: 论坛刚成立,没有人气,需要手动发帖 发帖基本都是在google reader中找到感兴趣的转载过去 怎样才能自动做到这一点?传说中的自动灌水机? 样品Demo:http://www.unswbbs.com/feed2.php

Posted in Discuz, VPS相关, 其他, 编程 | Tagged , | 1 Comment

转载 Python写的校内网自动发帖机

我在研究一个课题,上一篇博客就已经写了,现在Google Reader端已经搞定,过一阵写个总结出来,呵呵 现在开始着手搞发帖部分的代码了,弄了个校内网的发帖机作为参考,呵呵 其实因为我直接做后台的,可能都不必那么麻烦,直接改数据库和网页即可:)

Posted in python, 编程 | Tagged , | Leave a comment

转载 使用非官方Google API

最近一直有往论坛灌水的行为,一般都是从google reader上转载 久而久之就有点腻,心想,如果能直接抓取我想要的内容该多好啊 于是就转而搜索起这方面的文章了,本文是找到的第一篇好文,呵呵 业余时间一直在做RSS新闻的Filter,不过这个也是进行的拖拖拉拉有很长时间了。之前很长一段时间有很大的功夫花费在写爬虫、写 Parser,RSS的协议虽然不是很多,不过也有点五花八门,Atom两个,RSS3个还有RDF的。后来有一天注意到Google Reader也提供RSS feed,当时很奇怪,他再提供feeds能干吗呢?查了查Google Reader API,官方始终没有正式版本,不过已经有很多Google Reader API的分析文档,很全,很强大。 于是,爬虫简单了,parser简单了,我不用去管那么多种类的rss协议了,我只要去抓Google Reader就好了,保证数据源及时量又足而且爬来的速度很快。以前一个有个问题就是假如你有200个feed要去爬,五个线程,桌面程序去爬,没有个 30分钟基本是爬不完,现在好了~~推荐写Feed Aggregator实验或者应用的同学使用,呵呵。

Posted in 其他, 编程 | Tagged | Leave a comment

UNSW生活体验-by传播系中国留学生

Posted in 其他 | Leave a comment

转载 10个Google Analytics使用技巧

几乎每个网站都会统计自身的浏览状况:日IP、PV、跳出率、转换率、浏览者属性等。了解这些数据有助于更好地了解浏览者的属性、知道网站在什么地方存在缺陷,为更好地提供服务、提高网站收入都有所帮助。 对于大多数网站而言,Google Analytics是最普遍选择的方案,因为Google Analytics提供了非常强大的功能,最重要的是,它是免费的,而且不会像某些统计网站那样,会要求网站主在网站上标明是用它来统计的。 但是,很多人在使用Google Analytics时只是简单地将Google提供的统计代码放到网站中去,实际上Google Analytics有不少鲜为人知的实用技巧,这篇文章将介绍其中一些

Posted in 其他, 站长 | Tagged | Leave a comment

灌点水~~

第一件事:无聊闲逛,居然发现连个轻小说(主要是日本翻译过来的小说)都能构成一个还算挺繁华的论坛 http://www.lightnovel.cn/index.php 国内筒子们简直逛论坛成性啊,pfpf 第二件事,今天尝试了一下用google forms,http://wiki.unswbbs.com/doku.php?id=joinus。 总体还成,就是嵌入网页如果不是放在头部的话好像显示上回有点小问题。还有,做网页是越来越有心得了。感觉已经初窥门径了,不错不错。

Posted in 其他 | Tagged | Leave a comment

Discuz论坛技术:条件显示首页四格

问题描述: 如果用户没有登陆,则不显示首页N格 如果用户已经登陆,则显示首页N格 解决方法: 因为首页四格的显示是在模板 templates/default/discuz.htm下 找到 <!–Insertion Start 4ge –> 语句,在这之下的代码插入了首页四格

Posted in Discuz, 站长 | Tagged | Leave a comment

linux sed 批量替换多个文件中的字符串 zz

linux太强大了,君不见,这么个一行代码,windows下面就是一个共享软件,还要注册的@@ linux sed 批量替换多个文件中的字符串 sed -i “s/oldstring/newstring/g” `grep oldstring -rl yourdir` 例如:替换/home下所有文件中的www.unswbbs.com为unswbbs.com sed -i “s/www.unswbbs.com/unswbbs.com/g” `grep www.unswbbs.com -rl /home` 这个` 符号是F1下边,tab键上边,数字1左边的那个,不是单引号 ‘ 简单吧,就这么简单,不过我真傻,以前为了实现这个功能,居然写了N长的一个shell………那个寒啊~~

Posted in Linux, 其他, 编程 | Tagged , | Leave a comment

用Twill工具来做网站压力测试

今天发现了个不错的东东,叫twill,是用python写的 主页在这里http://twill.idyll.org/ 这东西好就好在可以用命令行登录,然后模拟用户执行操作,并且可以开无数个这样的进程,测试压力。我最早只是苦于不知道如何用python处理登录和cookie的东东(其实我哪个语言都不知道该怎么做呵呵,这可能要看些html的书,我是静不下心来看,有现成的包就用现成的包呗) show一段吧:自动搜索google的代码: setlocal query "twill Python"   go http://www.google.com/   fv 1 q $query submit btnI # use the "I’m feeling lucky" button   show

Posted in Linux, 站长 | Tagged | Leave a comment