-
无root权限安装zsh
在很多情况下,我们安装是拿不到root权限的,比如公司的开发机,或者学校服务器的某一个账号。更糟糕的是,可能这台机器还是不允许连接外网的。本文主要是记录下在zsh安装过程中踩的坑。step 1:安装依赖nurses执行以下操作就可以了# Download the ncurses gzipped tarballwget ftp://invisible-island.net/ncurses/ncurses.tar.gz# Extract gzipped tarballtar -zxvf ncu...…
-
DSSM系列论文笔记
Learning Deep Structured Semantic Models for Web Search using Clickthrough DataDSSM:深度语义模型,主要目的是计算query和document的相似度,该模型是通过将文本数据已经用户的点击历史记录映射到一个相同维度的语义空间,计算query和doc之间的cosine相似度来返回query的召回集合。DSSM是一个监督学习的过程,假定query和点击doc是相关的,通过监督 学习的方法学习模型参数,目标函数是最...…
-
面试中的计算机基础
在找计算机相关的工作时,有一些基础是作为计算机学生必须了解的,总结如下排序算法归并排序标准归并排序的实现,可以是通过递归,平均时间复杂度是O(nlogn),空间复杂度是O(n)def mergeSort(nums, left, right): if left >= right: return nums mid = left + (right - left) /2 mergeSort(nums, left, mid) mergeSort(nums,...…
-
信息流产品与内容推荐
这篇文章写于听了吴锴的了解信息流产品和内容推荐算法写的摘要笔记。 信息流产品的价值,用户粘合性方面?商业营收?行业内的数据 信息流产品如何做推荐 一般使用的指标 决定信息流整体推荐信息因素 信息流用户画像的建立信息流产品的特点1> 在合适的场景为用户提供合适的内容2> 适合手机屏幕,手指上下流动3> 数据量做够大,能够不断刷新内容信息流产品的价值商业上的价值:信息流产品已经成为用户接受的高效变现模式用户的价值: 是一个拥有海量信息,及时新鲜的内容可以给用户带来便...…
-
关于矩阵乘法的那点事
不知道你们在用numpy或者tensorflow的时候有没有总是一种苦恼,就是分不清楚点乘,乘法以及内积外积。发现之前都是瞎搞,所以现在闲下来想要彻底搞清楚下。内容List: 内积与外积 点乘和矩阵乘法 numpy和tensorflow中的使用内积与外积内积:一个行向量乘以一个列向量称作向量的内积,又叫做点积,结果是一个数。外积:一个列向量乘以一个行向量称作向量的外积,一种特殊的克罗内克积,结果是一个矩阵。向量的点乘也叫向量的内积,是对两个向量执行点乘运算,就是对两个向量对应位一一相...…
-
ctr预估model总结
所谓CTR预估,就是点击率转换的预估,即click through rate, 一般用在推荐广告系统中。简单来说,就是当用户预览网页或者在使用APP的时候,在用户浏览的页面中插入一些广告,如果用户在浏览的过程中点击了这些广告,就算做是一次成功的转化。因为考虑到了用户的因素,因此针对不同的人不同的爱好,系统会推荐不同的广告。如果是离线系统,一般采用AUC进行系统性能的评估,如果是在线系统,一般采用A&B Test的方式进行系统评估。在推荐系统中,输入样本的特征包括了数值特征和类比特征...…
-
corenlp多线程使用
本文的应用是stanford corenlp多线程的使用,在对数据进行分词、词性标注和命名实体识别的过程数据量较大,处理时间较长,单线程已经不能满足需求。这个使用场景是,读取文本,每一行是一个json类型的字符串,需要将其中部分文本进行词性标注等处理,然后再写到新的一个文件中(多线程读同一个文件,处理后,多线程写同一个文件)- java 使用corenlpjava中的多线程下图所示是一个线程的生命周期,在java中可以通过三种方法来创建线程:1 通过实现Runnable接口2 通过继承Th...…
-
机器学习面试总结
在找工作的过程中,发现自己真的好多知识点没有真正掌握,所以打算重新学习整理并记录下。线性回归在线性回归中,我们假设样本的噪声符合高斯分布。$f(x) = \sum_i^{d} x_j w_j + \epsilon$, 其中$\epsilon $ 服从标准正态分布,也就是此处的因变量也服从均值为$\sum_i^{d} x_j w_j $正态分布。最小二乘估计和最大似然估计最小二乘估计,最合理的参数估计量应该使得模型能够最好的拟合样本数据,也就是估计值和观测值之差的平方和最小。最大似然法,最合...…
-
Java中的Json包使用心得
首先要说下之前用的是json lib那个包,在应用过程中有个bug, 于是选用了轻量级的解析工具包org.json.jar在用json lib这个包时,同时需要你加入其他的依赖包,需要注意各依赖包之间的版本兼容。在应用过程中,出现如下问题: JSONObject obj = new JSONObject(); obj.put("test_string", "null") //put进去的是字符串"null"转为json对象时不能识别数据类型,结果是{"test_string", nul...…
-
关于为什么pagerank能收敛
pagerank的主要思想 如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高 如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页的PageRank值会相应地因此而提高算法原理PageRank算法是互联网中的众多网页看做是一个有向图,如上图所示。算法过程是把网页预先给网页一个PR值(一般取$\frac{1}{N}$, N 为网页总数)。然后通过以下公式不断更新PR值,直到收敛:其中$M_{p_i}$ 是所有对$p_i$...…