• 大众点评数据挖掘岗综合题

      题目:N个为排序的整数,在线性时间内,求这N个数在数轴上相邻两个数之间的最大差值(写出关键算法)顺便吐槽一下,大众点评Java考得真多,综合题的第一题要求用Java用递归实现阶乘计算,虐得真惨,找完工作…

    • DataHub大数据岗位笔试面试总结

      笔试:#linux命令    1、查看磁盘空间的命令、查看目录空间的命令   2、写一行命令,kill掉zuxs用户下所有进程名带dba_的进程,用到通道。  #设计模式1、用代码实现一个线程安全的单例模式。单例我写出来了…

    • 2015年3月4日阿里数据挖掘工程师电话面试总结

      1.Feature,即特征是什么?他原本问我的是我做的数字识别里面的特征是什么,以我之前对特征的理解,比如神经网络,我认为是参数层所表达的便是特征。因此,我才不能明白他所说的特征到底是什么含义。 现在我…

    • 华为大数据实习生面试总结

      上周一的时候拿到了华为的最终实习offer,这里不得不提一下华为的offer制度,等待真是一个让人消磨性子的过程 从3月末选来选去决定去华为实习,到上周拿到offer,差不多刚好一个月。中间经历了笔试和两次面…

    • 大数据处理面试

      第一部分、十道海量数据处理面试题   1、海量日志数据,提取出某日访问百度次数最多的那个IP。 方案:首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最…

    • 如何解决BAT笔试面试过程中经常出现的大数据处理类题目?

      现在BAT笔试和面试非常容易出现大数据的问题。例如:对5亿个整数进行排序,并输出到文件中。有5亿个ip,找出出现次数最多的ip等等,这些问题的共同特点是数据量较大,并且常规的读入内存在处理行不通,或者…

    • 大数据工程师面试题

      你曾经参与或主导过哪些大数据类型的项目?项目目标是什么?你具体担负的哪个角色? 使用哪些算法? 使用哪些统计方法? 如果解决用户商品匹配的话,你会采用什么类型的模型? 二部图模型有什么缺陷…

    • 在2.5亿个整数中找出不重复的整数,注,内存不足以容纳这2.5亿个整数

      首先我们考虑在内存充足的情况下,我们可以使用python中的字典结构。对2.5亿个数中的每一个数,出现一次,字典对应的值+1. 最后遍历字典,找出value为1的所有key。代码很简单,10行都不到。 内存不充足…

    • 针对常见的BAT公司中的大数据面试和笔试问题

      现在BAT笔试和面试非常容易出现大数据的问题。例如:对5亿个整数进行排序,并输出到文件中。有5亿个ip,找出出现次数最多的ip等等,这些问题的共同特点是数据量较大,并且常规的读入内存在处理行不通,或者…

    • 面试--- 关于海量数据问题的处理详解

      问题: 微博有11亿的用户,其中大约50万是蓝V用户,用户用uid标示,试设计一套架构,判断一个用户是否是蓝V,画出架构图,并给出关键算法。要求消耗的内存最小,效率最高,同时能够适应蓝V用户的动态增减。 …

    12