其次,利用 Linkedin 的数据,Hunter and Zaman (2017) 抓取了所有领导团队成员在成立/加入本公司之前的工作经历,并从中计算出了如下代表他们工作经验和背景的特征。
在计算工作重合度时,Hunter and Zaman (2017) 采用了 Jaccard Index(一种评价两个集合中元素相似度的常见方法)。具体方法为,领导团队成员两两配对,找出他们之前工作单位的交集和并集,用交集中成员的数量除以并集中成员的数量求出 Jaccard Index。这个指标的取值在 0 到 1 之间,是工作重合度的度量,越高说明重合度越高。对于每个配对,都能得到一个 Jaccard Index,然后计算这些 Jaccard Index 的均值和标准差,作为工作重合度的均值和标准差。
在领导团队的教育背景方面,Hunter and Zaman (2017) 考虑了最高学历、是否毕业于名校、以及教育背景重合度等特征。这些特征包括:
在名校的表单中,Hunter and Zaman (2017) 仅考虑了美国的学校(这是个不足?),它们包括:伯克利、布朗大学、加州理工、卡耐基梅隆、哥伦比亚、康奈尔、达特茅斯、杜克大学、哈佛大学、约翰霍普金斯、麻省理工、西北大学、普林斯顿、斯坦福、芝加哥大学、宾夕法尼亚大学、以及耶鲁大学。在计算教育背景重合度时,同样采用的是 Jaccard Index,不再赘述。
对于团队教育背景和公司所处行业的相似性,Hunter and Zaman (2017) 使用了 WordNet 词汇数据库,计算每个领导团队成员学术专业和公司所处行业之间的语义相似度(具体方法是 Palmer-Wu 相似度分数,见 Wu and Palmer 1994)。得到由每个成员计算出的相似度后,取它们的均值作为团队教育背景和公司行业的相似性的度量。
最后一个关于创始团队的指标是在成立该公司时,团队的平均年龄。出于年龄数据不全的考量,作者假设团队成员 18 岁高中毕业、22 岁本科毕业,然后根据他们获得相应学位的年份和公司创办的年份计算出目标年龄。