第322章有私心的苏小木

“呀，这是苏小木学长！”
“在哪呢，在哪呢……”
“哇，小木同学开车来上学了？”
“这么有钱的吗？”
“你怕是不知道小木学弟才拿了多少奖金吧？ACM-ICPC的总冠军奖金都是美元为单位的。”
“买个小大众，问题不大的。”
“小大众？怎么那么像迈腾？要一二十万吧？”
“小木学长在校外供职于某公司，拿的是高工资，说不定还是公司给配的车呢！”
“哇，小木学弟关车门的姿势好帅！”
“弯腰拿包的姿势也好帅啊……”
“……”
苏小木根本不知道就这短短的一两分钟的时间里，就产生了这么多的议论。
倒是有感觉到不少灼热、炙热的视线。
习以为常，并没有太多的想法。
很快就根据课表去了教室。
如今不管是什么样的课程，哪怕是马哲，苏小木也会认真去听。
“其实不是知识限制了我的想象力。”
“是知识面与偏见。”
苏小木喃喃自语。
因为对历史心存偏见，所以完全不看重历史。
却不知道，哪怕所有的历史都是由胜利者书写的，那也是有参考意义的。
看看苏荷，并没有专修历史，但也对很多历史事件信手捏来。
就更不用说万黛了。
时间就在学习中飞快度过，论专注，苏小木还是有点发言权的。
上午的课程结束后，苏小木并没有回家或者去木数。
而是去了张可教授的课题实验室。
…………
…………
苏小木刚刚走进去，迎面就碰到正在操作台上捣鼓着什么的谭凌抬头。
谭凌笑着道，“来了，小老弟。”
“诶，学长。”苏小木应了声。
“教授要1点30分才过来，他们也得一会才过来，你自己招呼，我还得忙一下。”谭凌说完就继续忙自己的事情了。
课题实验室并不是每时每刻都有人忙。
偶尔也会遇上没人的时候，以及现在这样，就谭凌孤零零的时候。
苏小木也是熟门熟路的人，自己找了个操作台坐下。
很快，张可跟林唐等人一块过来了。
“呦，小木同学今天来挺早。”张可呵呵笑道。
平时苏小木来得都算比较晚的。
毕竟本科阶段，尤其是……本科才二年级，学业还是挺繁忙的，不像其他硕士阶段和博士阶段的学长学姐。
大多数时间都是泡在课题研究上。
苏小木挠了挠头，腼腆一笑。
自从林唐知道苏小木有女朋友后，明显没那么开怀了。
都不怎么撩苏小木了。
只是简单打了个招呼。
一群人看着张可，大家都不知道今天张可突然召集大家过来做什么。
“今天找大家过来，是因为所有的课题前准备已经完全完成，谭凌，你先跟大家简单说一下。”张可也没多啰嗦，直接开始了正事。
谭凌点头，起身说道。
“经过近一个月的准备，前期所有的相关知识储备与小课题实验研究已经全部完成，包括课题实验所需的云计算平台、存储、实验参考数据……等均已准备完成……”
“……”
张可接过话头，“今天，我们便启动『大数据·算法、主导数据与行为模型』课题。”
张可的话语落下后，苏小木等人都没有太意外。
这个大课题拖的时间挺长了。
也是时候开始了。
不过大家都有意无意的看了眼苏小木，心里都明白张可有很大概率是为了等苏小木完成ACM总决赛。
没等大家开口，张可问道，“你们觉得，什么是大数据？”
这个问题问出后，苏小木、谭凌、林唐等人都陷入了沉思。
张可教授要听的肯定不是网络上的那些烂而化之的回答。
而是他们每一个人自己的总结。
从生活中、从学习中、从自身经历的方方面面进行总结归纳并给出答案……
一般看来，大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。
是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
从技术上看，大数据与云计算的关系就像一枚硬币的正反面一样密不可分，必须采用分布式架构，必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
同时大数据还需要特殊的技术，来有效处理大量的容忍经过时间内的数据。
这些技术包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
IBM也曾提出了大数据的特点：大量、高速、多样、低价值密度、真实性。
但，大家都不会简单的从这些概念上的东西来进行回答。
良久。
谭凌开口道，“我认为大数据就是数量庞大的任意数据，甚至这些数据本身并没有什么卵用，而且还没什么价值，扔之可惜。”
“当然，大数据其实始终贯穿着人类的历史，从古至今的各种法例都能看到大数据的踪迹。”
“比如连环案件分析？”林唐插嘴道。
也不知道林唐是不是最近看柯南看多了，张口就是连环案件。
其他几人各有回答。
独剩下苏小木沉默不语。
“小木同学，你来说说？”张可点了名。
苏小木简单的答道，“说不好，我觉得大数据无非就是多维分析，最终针对的还是人。”
“每个人都有每个人对大数据的理解，我们的课题只是从大数据出发，探索主导数据、行为模型的一个片段。”
张可道。
“大家可以通过课题，去找到每个人对大数据的新理解。”
“硬件层面的准备基本完善，但软件层面的部署还得我们亲自来，首先是分布式文件系统，我们讨论一下，是否直接使用Hadoop实现的分布式文件系统：HDFS？”
张可的问题引发了课题实验组每个成员的意见发表。
首先HDFS基本上是个通用的大数据分布式文件系统，最重要的一点是设计就是用来部署在低廉硬件上的。
包括Hadoop，完全就是为了大数据而开发的程序。
Hadoop框架最核心的设计就两点，HDFS和MapReduce。
HDFS为海量数据提供了存储方式，MapReduce为海量数据提供了计算。
苏小木试图争取了一下，“教授，如果我们课题的时间足够长的话，不如我们试试自己实现，不借用Hadoop，重新设计分布式文件系统、并行运算算法、并行处理数据库这些。”
“这样一来，专业针对的就是课题本身的算法、主导数据与行为模型。”
苏小木的话是有道理的，当然也是有私心的……
======
2更。

第322章 有私心的苏小木

第322章有私心的苏小木