分类目录归档：代码欣赏

Python的确是非常棒的语言

8月 18, 2012 jianshuo 2条评论

早上6点半爬起来，花了几个小时学习Python。

只能感慨我来晚了，晚了12年。在我在微软做工程师的时候就应该学习这种语言了。显然Python有很多优于PHP的地方，就像PHP对于写网站有太多因为“幼稚”而优于Java的地方。

一句话形容Python和PHP的区别：

PHP去掉所有的额外输入$ ; { }，把function改成def， => 改成点，基本上就是Python了。

哈哈。只是开个玩笑，但Python的很多设计还是如此的一致和简洁。比如class里面就是没有从天上掉下来的$this，处理帮助也都用函数help()。

语言本身是有高下差别的。只要看一下开发社区在“自己的时间里”用什么语言，就大概能够猜出来些门道。好多程序员在工作的地方必须用Java或者PHP，或者.NET，但的确有很多程序员选择了Python来写自己的项目。说明这里一定有一些东西在发生。不去看看是不知道的。

愿意学习一种新的语言是一个好的程序员身上带有的很特殊的味道。Hacker本身就是不遵循任何规矩，自己动手丰衣足食的那种精神，而语言作为作重要的一种工具，是一个好的hacker不断寻求的。对于语言的追求，可以当作选择好的程序员的一种标准。

代码欣赏

在Blog上面集成Facebook Connect

12月 12, 2008 jianshuo 29条评论

刚刚把Facebook Connect在我的中文和英文的blog上面实施了一下。这样子，如果你有Facebook的账号，你就可以直接点那个Facebook的按钮，你的Facebook的信息，就自动填在评论的表单里面，你的评论旁边就有了你在Facebook的头像，而且接下来，我还可以让在这里的评论自动发表在Facebook里面，可以让别人看到。

做这些事情还是需要一点简单的JavaScript的编程。我有两个惊讶的事情：第一，Facebook的编程模型的确诡异，几乎所有的函数调用都接受一个回调函数作为最后一个参数，函数执行不是以返回结束，而是通过调用回调函数结束，这样就出现了迷宫一样的一个函数潜逃一个函数的状况，以及结束时候多达10个的右花括号或者右括号。第二，Facebook如何在一个Blog站点上面集成这样一个通用的应用，居然在他们的网站上面没有例子。如下的几行代码，倒还真是让我花费了一段时间，直搞得我眼花缭乱，耗时2个小时才搞定。所以想我应该把过程记录下来，以便其他blogger可以借用，同时也显摆一下，说明Hello World级别的编程，我还是可以的。

步骤

假设你有一个blog，无论是MovableType架的，还是WordPress，或者自己写的，只要你有一个留评论的表单，应该都可以使用这个办法。这是一个纯JavaScript的应用，不需要服务器端的编程。

看看这篇文章《尝试Facebook Connect（英文）. 按照里面的第一步（包含8个小步骤），和第二步，注册一个新的API密钥，然后设置一下你的回调文件所在的文件夹。我设的是：http://home.wangjianshuo.com/scripts/facebook folder。这个里面放着Facebook给的xd_receiver.htm文件。按道理我应该复述一下步骤的，不过复述步骤是在99年的时候做微软的支持工程师的几年做腻了的事情，不想再做了。大家移步到那里去看吧。
进入你的编辑器，来编辑模板。MovableType中要改的是“Invidivial Arcihve Page”，其他的工具应该也有类似的名字。
把HTML的根tag html从

<html xmlns=”http://www.w3.org/1999/xhtml”>

改成

<html xmlns=”http://www.w3.org/1999/xhtml” xmlns:fb=”http://www.facebook.com/2008/fbml”>

。注意，就是添加一个fb的命名空间。这个可的确是不容易理解。不理解也罢。
找到输入名字，邮件和URL的地方（通常是一些input），把下面的代码粘贴进去。这个主要是一些格式上的东西，让你的那个Facebook的按钮在输入框的右边。我最终还是觉得用table来布局远比用CSS float等方式要来的直接和不容易出错。这段代码里面真正重要的，只有Facebook登陆按钮那一段，我用红色粗体表示。

<table width=”80%” cellpadding=”0″ cellspacing=”0″>
<tr><td valign=”top” id=”authorInfo”>
Name: <br />
<input name=”author” /><br />
Email Address: (will not show)<br />
<input name=”email” /><br />
<input name=”url” /><br />
</td><td width=”50%” align=”right” valign=”top” style=”border-left:1px solid #336699″>
You can optionally sign in<br/> with your Facebook account.<br/>
<fb:login-button autologoutlink=”true” length=”long”></fb:login-button>
</td></tr></table>
把下面的一段贴在整个表单的后面，主要把apiKey,和xdPath替换成你自己的。我假设你的表单叫做comments_form，你的应该叫其他的名字。

<script src=”http://static.ak.connect.facebook.com/js/api_lib/v0.4/FeatureLoader.js.php” type=”text/javascript”></script>
<script type=”text/javascript”>
      var apiKey = “655b6e2e042a5426d8f0b13dca4708fa”;
var xdPath = “/scripts/facebook/xd_receiver.htm”;
      FB.init(apiKey, xdPath);
      FB_RequireFeatures([“Connect”, “Api”], function() {
                  FB.Facebook.init(“655b6e2e042a5426d8f0b13dca4708fa”, xdPath);
                  FB.Facebook.get_sessionState().waitUntilReady(function(){
                              FB.Facebook.apiClient.users_getInfo(new Array(FB.Facebook.apiClient.get_session().uid), [“name”,”proxied_email”, “profile_url”, “pic_small”], function(result, ex) {
                                          if(result.length > 0) {
                                                document.comments_form.author.value = result[0].name;
                                                document.comments_form.email.value = result[0].proxied_email;
                                                document.comments_form.url.value = result[0].profile_url;
                                                document.comments_form.author.readOnly = “readOnly”;
                                                document.comments_form.email.readOnly = “readOnly”;
                                                document.comments_form.url.readOnly = “readOnly”;
                                                var authorInfo = document.getElementById(“authorInfo”);
                                                var img = document.createElement(“img”);
                                                img.src = result[0].pic_small;
                                                var td = document.createElement(“td”);
                                                td.appendChild(img);
                                                authorInfo.parentNode.insertBefore(td, authorInfo);
                                          }
                                    }
                              );
                        }
                  );
            }
      );
</script>
保存并且重新build一下你的文件

如果幸运的话，你看到的应该和我的这个blog的样子一样。不过。。。因为Facebook的异步和跨域通讯特征，我觉得一次调试成功的几率不大，尤其是根据这份极为简略的攻略来做。

如果有任何问题，可以留言。

代码欣赏

看看这个机柜

9月 9, 2007 jianshuo 18条评论

这东西是8年前的一个机柜。

下面的照片里面，绿色和白色相间的一条是reset的线，连着一个按钮，一条是普通PC的硬盘灯。四个这样按钮和灯用四个螺丝钉直接固定在一个硬纸板上面。

显卡的位置什么也没有插，其他的扩展槽也都空着。

只有一个网卡，和网线。

CPU是奔二的。

这个是整个的。

这个惠普的Switch总共有80条进线。

这一个机柜，总共是20层。每一层的架子上面垫着一层松木板的隔层，隔层上面放四个一摸一样的主版，四块硬盘放在中间一条。

这家公司最初的时候有30个这样的柜子。如果按照每台都是这个样子的话，那就是2400台最普通的台式机在一起运作。而这家公司现在估计有45万台这样的服务器。

我想了一下，99年的时候，其实很值得拼一下这样的东东的。

代码欣赏

Symbol表的启发

5月 16, 2007 jianshuo 5条评论

本文是《google.loader 代码欣赏》系列的一部分。

这段代码原本是非常好读懂的，但是当所有的函数名和变量名都用小写的a到z之间的一个字母代替以后，就变得不好读起来，尤其是这段令人抓狂的代码，

function k(c,a,b,d,e,f){
this.a=c;
this.g=a;
this.f=b;
this.d=d;
this.e=e;
this.b=f
}

不死一堆脑细胞是很难摸得到门路的。

其实，这说明，这个代码一定是经过编译的。说编译可能有点不是很准确，说“转化”或者更恰当些。为什么要这么做呢？

Symbol表

在整个代码的最后一句

g(“google_exportSymbol”,g);

泄露了些原因。

Symbol是什么？在Windows的世界（或者几乎所有的编译语言，或曰高级语言的世界里），都少不了Symbol这个东西。在编译的时候，所有的函数名，变量的名字，都会被一个地址或者一个标记代替，写进二进制文件里面，所以如果从一个.exe文件反编译出来，还是可以看得出执行的语句逻辑的（用汇编的形式），却永远无法获取原来的源代码。而Symbol文件，就是连接编译好的二进制程序，和源代码的桥梁，包含了关于函数，变量的名字以及源代码的文件名以及行数的信息。而Symbol文件编译以后，一般不和执行文件一起发布，需要另外去找。比方说当年调试IIS的时候，就把IIS的Symbol拿过来，再把源代码拿过来，用Windbg就可以开工了。。。这是以前的古老的Windows时代一个程序员要做的事情（对了，现在所有的Windows公开的Symbol可以在这里获得）。Symbol简直就是Windows世界里的解开二进制文件的一把神秘的钥匙。

Google Loader的Symbol库

既然有编译，就一定要有一张自己存着的对应表格。我猜测这个表格应该是这样样子的：

function “google_exportSymbol” => function “g”, @d:\my\code\uds\uds.js line #122
function “setApiKeyLookupMap” => function “p”, @d:\my\code\uds\uds.js line #102
function “load” => “o”, @d:\my\code\uds\uds.js line #77
function “writeLoadTag” => “m”, @d:\my\code\uds\uds.js line #115
var “google_exportSymbol”::”funcNameString” => “c”, @d:\my\code\uds\uds.js line#122
var “google_exportSymbol”::”function” => “a”, @d:\my\code\uds\uds.js line #122

需要说明的是，我没有原来的代码，也彻底不知道这个Symbol表是不是存在，甚至在这里开玩笑一样的假设原来的代码放在一台Windows的机器上面（显然这不是很可能），但我希望就是表达这么一个意思，就是说，如果有编译，就应该附属产生这样的一个Symbol表，只不过没有公布而已。如果没有这个表，debug会是一件和我们直接看源代码一样痛苦的过程。

DLL的exportSymbols

如果大家熟悉Windows的DLL文件结构的话，就会发现exportSymbols和importSymbols是一个常见的概念。就是说，虽说在DLL内部所有的函数的名字已经被编译的面目全非，就像这里的函数g()，函数q()一样，但是为了方便外界的调用，还是把一个标准的接口给输出(export)出去。打个比方，一个Windows XP上的c:\windows\system32\user32.dll就export了732个之多的函数（函数名是字符串，比如ActivateKeyboardLayout，实际的函数确实一个地址为：7E42D32Ah的EntryPoint。

微软的世界和Google的世界

一个微软的世界的基石应该是PE(Portal Exexcutable)的文件格式（也就是.EXE, .DLL所使用的格式），这些格式让DOS操作系统可以”load”到内存里面执行。

那么在Google的世界里面先出现了一个loader（就好比DOS的loader），然后作为load的基础函数出现了这么一个google_exportSymbols，这是巧合呢，还是意味着什么呢？

且听下回分解。

注：第二次（其实是不知道多少次）声明，以上纯属个人的主观臆断，就好像听到了“咕咚”的声音就惊呼“咕咚来了”的猴子一样。或许是真的“咕咚”来了，或许仅仅是一个熟了的果子掉到湖里而已。是哪一种？只有时间告诉我们。

代码欣赏

用匿名函数避免命名冲突

5月 15, 2007 jianshuo 12条评论

本文是google.loader 代码欣赏系列的第二部分。

第一个匪夷所思的地方，可能就是这一段了

if (!google.loader) {
google.loader = {};
google.loader.ServiceBase = “http://www.google.com/uds”;
google.loader.ApiKey = “internal”;
google.loader.KeyVerified = true;
google.loader.LoadFailure = false;
google.loader.AdditionalParams = “”;
(function() {
//大量的函数定义，变量声明以及函数的执行（整整100多行）
})()
}

基本上就是说，它写了一个这样的语法：

(function(){})()

就算是看得懂，这么绕来绕去，除了炫耀之外，又有意义呢？

匿名函数

先撇开Google的代码，看一下JavaScript其实是支持这种形式的行数定义的：

function(msg){ alert(msg); }(“hello world”);

这其实是两步：第一步，定义了一个函数，相当于：

var abc = function(msg) { alert(msg);}

第二步，立刻执行它：

abc(“hello world”);

把两个语句拼接在一起，然后去掉abc这个函数的名字，就成了现在的语法形式。

结合前面的

google.loader = {};

一起看，其实在这里是定义了google.loader这个对象的一个匿名的成员函数，并且立刻执行了这个成员函数（就是说完成里面的一些列初始化的时候需要干的事情）。

匿名函数的用处

虽然可以理解这里是个匿名函数，但是为什么要这么做呢？

我猜想（请注意，所有这里想的都是一个猜想，并且可能是众多原因之中的一种而已，欢迎大家补充），最主要的考虑是避免命名冲突。

因为这段JavaScript作为Google的其他的各项服务的入口，是会被全球很多的网页引用的。像任何的JavaScript引用（包括PHP的引用），如果被引用的代码和外面的代码一不小心用了同样的名字，就不可避免的发生命名冲突。对于小范围的代码或许还可以用起很怪异的名字的方法企图避免，而对于Google这样的应用，靠运气就有些说不过去。如果是一个匿名函数，外面将永远无法直接访问它（总不能写一个这样的一个没有函数名的调用吧：()）。从这一点来说，不可能有命名冲突。

封装

另外的一个好处，有可能是为了更好的封装。比如在这个函数里面，有很多的函数定义，比如

q(); p(); m(); g(); i()

还有大量的变量：

var j; var h; var l;

等等。在JavaScript里面没有简单的private这样的定义私有函数或者私有函数的方法。如果调用者可以随心所欲的访问到这些中间的（随时可能变化，甚至移除）成员。对于这么一个开肠破肚，一览无余的对象，从一个API提供者的角度来看（和使用者的角度来看），的确是个挺恐怖的事情。

如果放在一个匿名的函数里面，外界就再也没有办法直接访问到里面的函数了。内部的逻辑被完美的封装了起来。这样一来，这些函数和变量多么的安全！

安全是安全了，但是定义了这么多的函数，仅仅是为了不被外界访问吗？显然不是，所以接下来要做的事情，就是把这些函数输出出去，也就是google_exportSymbol，或者说是函数g()要做的事情。

且听下回分解。

注：接下来，或许还要说说：输出函数供开发者使用， JavaScript中的面向对象， prototype的扩展方式， Undocumented的神秘参数，编译后的JavaSscript好比汇编语言，和 Symbol表的启发。

代码欣赏

google.loader 代码欣赏

5月 14, 2007 jianshuo 9条评论

缘起

五一期间和老冒聊天，其中就提起来保持技术的敏感性是聊起技术型CEO的优势，也是一直需要不断努力充电的。很受启发，所以就顺手拿起一段Google的Javascript，欣赏一番。

这段JavaScript的URI（沿用Tim Berneris Lee喜欢用的URI而不是URL）很酷：

http://www.google.com/jsapi

在我写这篇文章的时候，也可以用这个URL也可以访问到：http://www.google.com/uds相同的内容。

单单挑这一段代码有几个原因：

这是分析最近的Google的所有代码的起点。在最近的Google AJAX Feed API的文档里面提到，“Google正在向一个新的编程模式转移”，说的就是这一行代码。比如AJAX Feed API的开始调用就用如下语法：

<script type=”text/javascript” src=”http://www.google.com/jsapi?key=YOUR_KEY_HERE”></script>
<script type=”text/javascript”>
google.load(“feeds”, “1”);
</script>

其中调用的就是这段神秘的JavaScript。
这段在浏览器里看起来不过27行，按照最标准的折行以后也不过100行的代码，第一遍看起来，真是彻底不知道它在干些什么，甚至怀疑它是不是用JavaScript写的。如果能很透彻的看懂这个代码，也就说明JavaScript的基本概念掌握的还可以。研究的时候，的确重温了n年前学习JavaScript的一些概念。
第三个原因，就是通过研究这个代码，可以隐约的感觉到一个新的基于Web的操作系统的到来。这个Google Loader，和早年的DOS加载模块是如此的神似，却有几乎没有任何形似的地方。通过这个代码，让我们可以窥到一些未来的样子。
最后一个原因就是，在我写准备写点东西的时候，把这段代码中最有标志性的google_exportSymbol函数拿到Google里面搜索，居然只有一篇文章提到，而且还仅仅是贴了代码。难道这么重要的一个文件，全世界的开发者没有兴趣分析一下吗？

好了，现在开始看代码。

代码全文

经过简单的代码格式化（仅仅加上回车），这段代码看起来是这样的。努力想想，他究竟是干什么的呢？

if (!google) {
   var google = {};
}
if (!google.loader) {
   google.loader = {};
   google.loader.ServiceBase = “http://www.google.com/uds”;
   google.loader.ApiKey = “internal”;
   google.loader.KeyVerified = true;
   google.loader.LoadFailure = false;
   google.loader.AdditionalParams = “”;
   (function() {
      Function.prototype.__google_inherits=function(c){
         var a=function(){};
         a.prototype=c.prototype;
         this.prototype=new a;
         this.prototype.__google_super=function(b,d,e,f){
            var n=Array.prototype.h.apply(arguments,[1,arguments.length]);
            return b.apply(this,n)
         }
      };
      var h=null;
      var l=false;
      function i(c){this.a=c}
      i.prototype.c=function(c,a){
         var b=””;
         if(a!=undefined){
            if(a[“locale”]!=undefined){
               b+=”&hl=”+encodeURIComponent(a[“locale”])
            }
            if(a[“nocss”]!=undefined){
               b+=”&output=”+encodeURIComponent(“nocss=”+a[“nocss”])
            }
            if(a[“other_params”]!=undefined){
               b+=”&”+a[“other_params”]
            }
         }
         if(h!=null&&!l){
            b+=”&key=”+encodeURIComponent(h);
            l=true
         }
         return google.loader.ServiceBase+”/?file=”+this.a+”&v=”+c+google.loader.AdditionalParams+b
      };
      function k(c,a,b,d,e,f){
         this.a=c;
         this.g=a;
         this.f=b;
         this.d=d;
         this.e=e;
         this.b=f
      }
      k.__google_inherits(i);
      k.prototype.c=function(c,a){
         var b=””;
         if(this.d!=undefined){
            b+=”&”+this.d+”=”+encodeURIComponent(h?h:google.loader.ApiKey)
         }
         if(this.e!=undefined){
            b+=”&”+this.e+”=”+encodeURIComponent(c)
         }
         if(a!=undefined&&this.b!=undefined){
            for(var d in a){
               if(this.b[“:”+d]!=undefined){
                  b+=”&”+this.b[“:”+d]+”=”+encodeURIComponent(a[d])
               }
               else
                  if(d==”other_params”){
                     b+=”&”+a[d]
                  }
               }
            }
            google[this.a]={};
            if(!this.f&&b!=””){
               b[0]=”?”
            }
            return this.g+b
         };
         function o(c,a,b){
            var d=j[“:”+c];
            if(!d){
               var e=new Error(“Module: ‘”+c+”‘ not found!”);
               e.toString=function(){
                  return this.message
               };
            throw e;
         }
         else{
            m(“script”,d.c(a,b))
         }
      }
      function q(c){
         var a=window;
         if(a.addEventListener){
            a.addEventListener(“load”,c,false)
         }
         else if(a.attachEvent){
            a.attachEvent(“onload”,c)
         }
         else{
            a[“onload”]=c
         }
      }
      function p(c){
         var a=window.location.href;
         var b;
         var d=a.length;
         for(var e in c){
            var f=a.indexOf(e);
            if(f!=-1&&f<\/script>’)
         }else if(c==”css”){
            document.write(‘<link href=”‘+a+'” type=”text/css” rel=”stylesheet”></link>’)
         }
      }
      function g(c,a){
         var b=c.split(/\./);
         var d=window;
         for(var e=0;e

真的要分析完全这里面的有趣的东西，还真是要点时间。不如分步骤，一个话题一篇文章，这样看起来容易一些。估计一天晚上也写不完，正好大家和我一起来看这段代码。

王建硕

分类目录归档：代码欣赏

Python的确是非常棒的语言

在Blog上面集成Facebook Connect

看看这个机柜

Symbol表的启发

用匿名函数避免命名冲突

google.loader 代码欣赏

《旅行的艺术》是本好书