在线试读

get_product_contenthtml     译者序2010年2月,春节将至,我向博文视点的某个邮箱寄出了一封请求参加翻译任何一本图书的邮件。很快,有人回信了,内容简单明了:请下载并试译第1章1~17页内容。落款是博文视点编辑徐定翔。于是我试译,寄出,然后等待。春节过去了,一切都从节日的慵懒中苏醒过来——包括我的试译结果——它来了:通过。合作事项很快商定,工作就这样开始了。如今已是2010年8月,稿件已如期交付,按照出版惯例,我可以占用一点篇幅,谈谈这本书。正如O’Reilly出版社的HeadFirst系列的其他图书那样,本书在语言组织、排版设计方面非常有特色,用“新颖”二字形容毫不为过,用“周到”二字形容也十分妥当。其构思跌宕起伏,其行文妙趣横生,无论读者是职场老手,还是业界新人;无论是字斟句酌,还是信手翻阅,相信都能跟着文字在职场中走上几回,体味数据分析领域的乐趣与挑战。一本技术图书,在传道授业之外,又为读者送上了章回小说的精彩。这些设计巧妙的“章回”生动地向读者展现了数据分析基本步骤、实验方法、很优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧,此后意犹未尽,又以3篇附录介绍数据分析十大要务、R工具及ToolPak工具,在尽情展现目标知识以外,为读者搭建了走向深入研究的桥梁。与我们司空见惯的很多书籍不一样,本书更愿意引导读者进行思考,而不愿向读者灌输现成的条条框框去禁锢读者的想象空间。在本书点到即止的启发下,读者很有可能跃跃欲试,急不可待地要把目光投向更宽、更深的知识领域,发掘更多的数据分析知识,以便早日成为数据分析达人。文章字里行间流露出作者传道授业的热忱,以下仅举两例:一是设法克服术语的障碍。这一点,英语使用者恐怕比中文使用者体会更深,层出不穷的英语术语甚至让以英语为母语的读者感到厌倦和头痛,作者深知这一点,于是尽量用浅显的语言表述,解除英语读者的心头之患;至于中文,感谢祖国语言的优秀特性,倘若作为译者的我没有在这里帮倒忙,术语方面的问题甚至可以忽略不计了(为方便读者审评,部分术语翻译对照表可在此下载:http://images.china-pub.com/ebook195001-200000/197047/shuyu.pdf)。二是设法实现理论与实践的转化。理论如何向实践转化,一向是学习者的难题。然而本书精心构思的“章回”体裁,却让理论知识与实际操作水乳交融,职场气息扑面而来,除了谈分析,作者也谈经济、谈局势、谈心理、谈做人,涉猎广泛,面面俱到。能够理解,作者希望这本书成为读者书架上的常备手册,在读者走进数据分析领域之初,或是遇到从业疑难时,提供力所能及的帮助。我也如此希望。最后,请容我借本序致谢:感谢博文视点。感谢徐定翔编辑对我的信任和指教。感谢家人对我的理解和支持。李芳2010年8月 I 序言如何使用本书序言本节回答一个热门问题:“作者为什么非要把这些东西写进一本讲数据分析的书里?”真难以相信,他们竟把这些东西写进讲数据分析的书里了。序言 I 如何使用本书 II深入浅出数据分析谁适合阅读本书?谁该和本书说拜拜?请先回答几个问题:请先回答几个问题:如果以上问题全部回答“对!”——这本书适合你。只要有一个问题回答“对!”——你与本书无缘。[营销部捎话——只要有就可以买书哦。] 你喜欢笑语喧哗的晚宴甚于枯燥、无聊的学术演讲,对吗? 3你想学习、理解和记忆如何创建靓丽的图形、试验假设条件、进行回归分析或整理混乱的数据,对吗? 2 2 你从未用过MicrosoftExcel或OpenOffice calc,对吗?你觉得,数据中隐含了无穷的智慧,只要有合适的工具,就能利用这些智慧,对吗? 1你是一个经验老道的数据分析师,正在调查数据分析领域最前沿的课题,对吗? 1你惧怕尝试新事物,宁可上山打虎也不愿标新立异,对吗?你认为要是用拟人的手法叙述控制组和目标函数,技术书籍就难免有失严肃,对吗? 3序言序言 III “这怎么能是一本严肃的数据分析图书呢?” “这些图都是用来干嘛的?” “我真能这样学数据分析吗?”你的大脑渴望新事物。大脑总是不停地搜索、探查、等待不同寻常的事物,它天生如此,这正是你活力的来源。那么,大脑怎么对待你所碰到的常规、普通、一般的事情呢?——它会竭尽全力阻止这些事情,以免干扰自己真正的工作——记录重要事项。大脑不会费力保存这些琐事;这些琐事从来不会成功地闯过“明显不重要事项”的关卡。你的大脑如何知道哪件事重要?假想有一天你出门旅行,迎面扑来一只吊睛白额大虎,你的头脑和身体会有什么反应?神经元发动……情绪激动……化学物质激增于是,你的大脑知道——这事重要!记住!但,想像你是呆在家里,或者是呆在图书馆里,也就是说,是在一个安全、温暖、没有老虎的地方。你正在复习迎考,要不然就是在努力弄明白一些艰深的技术,你的老板认为花个把星期就能搞定,顶多十天。专享的问题是:你的大脑想好好帮你一把,它试图保证不让这种“明显不重要”的内容去破坏珍稀的资源,这些珍稀的资源优选用来保存真正“重大”的事情,像老虎啊,像火灾险情啊,像你绝不该在大学生网站Facebook的网页上贴上那些聚会照片啊。没有什么便当的办法可以告诉大脑“喂,大脑,我对你感激之至,可惜啊,不管这本书多无聊,也不管我的情感地动仪如何纹丝不动,我真的希望你把这些材料都记住。”我们了解你在想什么我们了解你的大脑在想什么你的大脑觉得这很重要。你的大脑觉得这不值一提。行啊。才不过490页而已,这些枯燥、无聊、烦人的内容。既然要学习,怎样才能学会呢?首先,你得搞懂,然后,切勿遗忘;一字一句硬塞不是办法。根据近期新的认知科学、神经生物学及教育心理学研究结果,学习远不仅仅是读书认字。Head First知道怎么让你的脑筋动起来。下面是部分深入浅出(HeadFirst)教学原则:将知识图形化。图形比单调的文字好记得多,可以提高学习效率(记忆学习和转移学习的学习效率最多能提高89%);图形还能让知识更容易理解,相比将文字放在页脚和下一页,将文字放在相关图形当中或图形周围,学习者成功解决相关问题的可能性将成倍增长。采用对话式的个性化风格。最近的研究表明,要是回避一本正经的语气,代之以对话般的风格,以第一人称平易近人地给学生上课,学生的课后测验成绩最多可提高40%。多讲几个故事,少来一点高谈阔论,语气宜随和。别太郑重其事。想想看,一局笑语喧哗的晚宴和一场演讲,哪一样更让你惦记?引导读者深入思考:换句话说,除非读者主动调动自己的神经元,否则脑袋里不会发生什么大变化。只有激发读者的兴趣,引起读者的好奇,刺激读者的灵感,读者才能解决问题,得出结论,获得新知识。为此,讲授者要设计各种难题、练习,提出引人深思的提问,还要多让读者做一些让左右脑半球和多种感官都动起来的活动。牢牢吸引读者的注意力。大家都有这样的体验——“我是真想学,但看完第一页就晕了”。大脑注意的是不同寻常的、有趣的、奇怪的、引人注意的、出人意料的事情。学习一种新颖艰深的技术不一定非得枯燥不可,如果它不是这样乏味,大脑会学得更快。影响读者的情感。现已知道,人的记忆能力在很大程度上取决于要记忆的内容对情感的影响。我们关心什么,就会记住什么;我们对什么事有感觉,就会记住什么。这里讲的情感并非天灾人祸给人带来的撕心裂肺的伤痛情感,而是惊讶、好奇、感觉有趣、想追根究底之类的情感,以及在猜对一个字谜、在学会别人感觉难以学会的事情或是在意识到自己懂的东西居然比工程部那位开口闭口“我比你有技术”的张三还多时,油然而生的“我是老大”的感觉。我们认为该系列图书的读者都是学习者。IV 深入浅出数据分析如何使用本书序言序言 V元认知:对思考的思考怎样才能让我的大脑记住这些资料呢?如果真想学东西,而且想学得更快更深入,就要关注自己如何集中注意力。要思考自己的思考方式;研究自己的研究方式。大多数人在成长过程中都不曾学习元认知和学习理论方面的知识。人们期望我们学知识,但极少有人教我们如何学。但想象得到,捧着本书的你,的确想学习数据分析知识,同时可能不想花费太多时间。要想利用在本书中读到的知识,就得记住读过的知识,为此必须理解这些知识。为了淋漓尽致地发挥本书或任何书本或学习经验的作用,请管好你的大脑,请管好大脑对待本书的态度。诀窍在于让大脑把正在学习的新资料当做“正经大事”——对幸福至关重要的大事,像老虎一样重要的大事。若非如此,你就会陷入一场持久战:你竭力要记住新知识,大脑却竭力要把这些新知识踢出去。既然如此,如何让大脑像对待吃人的老虎一样对待数据分析知识呢?有两种办法,一种缓慢而乏味,一种迅速而有效。慢办法是简单记忆。你显然明白,只要不停地把同样的东西往大脑里灌,即使是最乏味的知识,也能学会、记牢。只要重复灌的次数足够多,大脑就会想:“这些东西给他的感觉并不重要,但他不停地看这些相同的东西,一遍,一遍,再一遍。因此我猜这些东西肯定很重要。”快办法是做一切增进大脑活动的事,尤其是不同类型的大脑活动。上一页讲了很多这样的活动,事实证明,这些活动全都能促使大脑以有利于己的方式工作。例如,研究表明,将文字放在文字所描述的图片当中(相反的做法是将文字放在页面中的其他位置,如注释位置或正文位置),会促使大脑努力搞清楚文字和图片之间的关系,进而发动更多神经元。更多神经元发动=更会让大脑明白某件事值得注意,可能还值得记住。对话式的写作风格对此很有帮助。人们在与人对话时注意力会更集中,原因是别人期待他们有所表现。令人惊讶的是,大脑不一定会在意