关系经济人类预测化学自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

你知道点击搜索框到出现搜索结果背后的故事吗

6月6日 喵小咪投稿
  搜索功能在各大APP中可以说是司空见惯的标配,相对社交流量的信息找人,搜索流量是人找信息,它传递的是一种我想知道的信息。搜索的算法设计可以很简单也可以很复杂,本文旨在带对搜索感兴趣的你了解点击搜索框到出现搜索结果背后的故事。
  搜索框设计思路
  先从搜索框的设计思路说起。UI元素不多提,主要强调一下宏观上针对不同用户的不同需求设计搜索模块的产品思维。
  我们看看iOS系统、产品经理APP、淘宝、Google的搜索位置和设计(如下图),从左到右依次是手机系统阅读类APP电商类APP搜索引擎的代表,用户在这些场景里对搜索的需求依次增强,搜索在页面上的表现形式也依次增强:搜索半隐藏搜索搜索在顶部栏固定索索是首页主体。
  (iOS系统、产品经理、天猫、Google搜索框设计)
  产品经理APP,搜索功能以icon的形式放在首页右上角,它的搜索功能非常弱(搜索结果常常不如人意),首页强调的是运营的结果你应该知道的信息,弱化了搜索功能你想知道的信息,也可能是出于开发成本的缘由弱化了搜索。
  在抖音和快手APP里,抖音将搜索功能以icon的形式放在首页左上角,快手将搜索功能放在个人页(二级页面)里,体验下来,抖音的搜索功能的体验比快手更好,快手也是避短了。以上从本质上说,都是为了给用户提供更好的产品体验。
  (左:抖音,右:快手)
  搜索算法
  搜索icon背后的逻辑是通向理想结果的通道,大致分为四步:
  用户输入内容(称query)
  分析用户搜索意图
  根据用户输入的信息对内容进行筛选召回
  对召回后的结果进行排序
  Step1:用户输入内容
  用户在搜索框输入的内容,常见的是文本,现在也有图片、语音的方式。
  在搜索框内设置引导暗文屡见不鲜,它既可以教育新用户可以搜索哪些关键词(如下左图),也可以承担运营推广、商业化的职能(如下右图)。
  (左:多抓鱼,右:美团)
  用户有时候会重复搜索同一内容,保留搜索历史就显得有必要了。移动APP的搜索历史记录大致有两种展示样式,列表式和按钮式,按搜索时间倒序排列,超过显示条数会被折叠。搜索历史删除功能有单条删除或一键清除两种。
  搜索历史记录下常配有热门推荐、特色栏目、话题榜等运营模块。在资讯APP中,以热度榜最为常见,以标题热度值或热度角标的方式出现,让用户能快速了解当前的热点从而点击感兴趣的内容进入消费场景。
  这些模块涉及各自的排序算法或业务逻辑,其中蕴含商业化和运营价值,如在热议榜中穿插运营活动或广告或搜索挂件,但要注意热度和体验的合理性,避免出现突兀感降低用户的信任感和体验感。
  (资讯APP搜索页面截图)
  如果内容类型较多,产品会倾向于先让用户限定范围再搜索,使搜索结果更精准,如微信搜索(如下左图),也有的APP是在搜索结果上做分类,如资讯APP(如下右图)。
  (左:微信,右:今日头条)
  除了历史搜索,有没有其他提高用户输入效率、降低输入错误率的办法?
  自动补全是不错的方法。这是基于产品定位或基于用户行为画像的联想部分,对于前者的理解,如用户在京东APP上搜索水蜜桃,用户是想购买水蜜桃,而不是想搜索水蜜桃的百科;对于后者的理解,如用户先前浏览过阴阳师手办,当他在搜索框输入阴阳师的关键词时,阴阳师手办会是自动补全的首选。
  (自动补全示例)
  另外,当用户点击搜索按钮后,若需要等待搜索结果,需要有加载提醒的标识,避免用户认为搜索功能无响应。
  Step2:分析用户搜索意图
  对用户搜索意图的分析涉及分词和词语处理。
  分词也称文本词条化,但总的来说用户更倾向于输入连衣裙蓝色代替我想要买一条蓝色的好看的连衣裙。分词依赖分词库和词性判断,前者需要维护一个和产品定位相匹配的词库(市面上已有很多开源且丰富的词库),词库的维护涉及新词发现,从大数据的分析可以将新词发现的流程自动化,人工抽检即可,例如词语中国有嘻哈是2017年才有的新词,代表一档Hiphop音乐选秀节目。而词性判断涉及用词性库和上下文去分析词语的词性。
  词语处理包括停用词过滤、同义词近义词转换、词条归一化、自动纠错等。
  停用词过滤指剔除的、了这类无意义的词或字,主要是通过词或字出现频次判断,市面上也有可用的停用词库。
  用户在使用搜索的时候难免会有输错关键词或表意不清的情况,这时候理解用户搜索意图需要自动纠错,主要是通过噪声信道模型去纠正用户的错误输入,纠错的类型一般有:
  同音纠错;
  形似字纠错;
  多字、少字、错别字、顺序错误;
  模糊音纠错,对英文输入来说,还有大小写归一化、词形时态的纠错等。
  结果页顶部最好保留疑似错误关键词的搜索结果入口,避免机器误判损伤产品体验。
  (百度搜索自动纠错示例)
  Step3:根据用户输入信息对内容进行筛选召回
  在对内容进行召回前,我们需要通过索引去连接内容,就像查字典时用的查字目录。搜索的索引是倒排索引(invertedindex),可以简单理解为需要根据属性的值来查找记录。
  以电商为例,如下图:
  (倒排索引示例)
  召回内容时一般根据相似度分值择优召回。以资讯APP为例,即计算关键词和文章的相似度,通常是通过tfidf算法计算关键词和文本的相似度(标题、摘要、正文等不同文本有不同权重)或通过embedding(向量化)召回。
  Step4:对召回后的结果进行排序
  排序可以考虑内容静态分,评论、点赞、收藏等业务数据可以是影响最终score的因素。如果有个性化部分(如电商),机器会基于用户画像,在召回和排序的时候将用户可能最关心的内容优先召回和排序。重排环节加上业务逻辑,如商业化广告、运营活动等,该次搜索的结果展示list就准备好了。
  对于时效性要求比较强的产品,如资讯APP,还需要加上一个时间衰减因子,避免将老旧内容先推出。
  Step5:搜索结果展示
  搜索结果展示页,常规的是根据相似度计算业务逻辑的关键词推荐,另一种是联想推荐,适合的场景有:
  在没有搜索结果或搜索结果较少的情况下拓展推荐,总比一个空白页好;
  除正常的搜索结果外,补充根据用户画像匹配的内容(用户感兴趣的概率高)或通过大数据计算出来的内容,作为一种兜底策略;
  承担某些运营功能。
  另外,在搜索结果页的一个小技巧,对命中关键词的文字进行高亮显示,让搜索结果更加一目了然。
  (资讯APP搜索庆余年,结果展示页)
  搜索指标
  以资讯APP为例,我们来看看搜索优化的核心目标、观测指标和算法评估指标。
  核心指标:搜索成功率有点击的query次数总query次数(成功的定义可以是一次搜索后有消费行为,如满足时长指标的点击等)
  全链路指标:
  搜索算法评估指标:NDCG(详细请看上一篇《做推荐业务,这4种机器效果测评方法你应该知道》)
  搜索商业化
  目前市面上常见的搜索商业化有:
  搜索框引导暗文
  搜索框皮肤
  搜索热门榜单
  热门搜索挂件
  搜索结果页优先推荐
  搜索彩蛋
  (左中:京东,右:淘宝)
  这些位置多以CPM(CostPerMille)和CPC(CostPerClick)的方式进行广告合作,常见的付费方式还有CPD(CostPerDownload)、CPA(CostPerAction)、CPP(CostPerPurchase)等等。
  对搜索后续发展的看法
  目前资讯APP的搜索较少个性化(电商搜索有部分个性化),主要是基于NLP去设计开发搜索功能。随着大数据和机器学习的发展,搜索的技术和功能设计也将会在NLP基础上,利用用户行为数据,往理解用户(queryunderstanding),搜索延展(queryexpansion)、搜索推荐(querysuggestion)纵深,如深度学习模型训练、Learningtorank,如根据用户搜索后的点击行为选择训练集等等,从而设计出更贴心懂你的搜索。
  我们通过几个问题感受下这种趋势:
  如果一次搜索无消费行为,二次搜索策略将如何优化?
  从大数据上看,某个关键词的搜索结果中,大多数用户倾向于点击一个相关性不如前排的内容,是否可以使用这类数据优化相关性的限制?
  用户在搜索结果页点击内容A后大概率会点击其下的相关内容B,这种用户行为数据能否用在搜索的优化上?
  一个喜欢吃苹果和一个喜欢使用苹果手机的用户,他们某些关键词的搜索结果会一模一样吗?
投诉 评论 转载

WG超模盛典MIA主秀童模董奕彤WG超模盛典MIA主秀童模董奕彤WG超模盛典是由唐山围冠文化传媒有限公司举办。于2022年10月5日在唐山宾馆完美落幕。来自唐山上百名童模齐聚现场,为我们带来视觉盛宴。……你知道点击搜索框到出现搜索结果背后的故事吗搜索功能在各大APP中可以说是司空见惯的标配,相对社交流量的信息找人,搜索流量是人找信息,它传递的是一种我想知道的信息。搜索的算法设计可以很简单也可以很复杂,本文旨在带对搜索感……秋季鼻子奇痒无比,喷嚏不止,到底应该怎么办?天气逐渐转凉,秋燥更加明显,鼻子不舒服成了许多人的大麻烦。其实,一到秋冬季,气候多变、干燥,天气忽冷忽热,人们普遍会感觉到阵阵寒意袭来,而且秋季花粉、尘螨增多,进一步刺激鼻黏膜……iOS16。1Beta5今日发布!更新功能北京时间2022年10月12日凌晨,Apple发布iOS16。1Beta5开发者测试版本,距离上次更新间隔7天,同时也发布了其他几个系统的测试版:版本说明更新版本:……河源佗城,岭南最早设置的古县之一,广东唯一保存完整的古城广东河源自驾游,我们最后一站,到达佗城。这是一座以南越王赵佗命名的古城,赵佗是龙川首任县令,他将中原文化带来了南越,文明之光得以发扬光大,自赵佗为后,佗城也成为了粤东当时……香港主机为什么会成为赌博色情诈骗等网站首选的主机?经过三年的技术和数据分析,我们最终发现关于赌博、色情、诈骗等超60使用的都是香港主机,其中仅赌博网站占比例高达30,色情网站占比例20,诈骗网站占比例10,另外,我们还发现多种……丫蛋与王金龙离婚6年迷雾下的他们,各自生活状况怎样?头条创作挑战赛点击关注,每天都有名人故事感动您!丫蛋与王金龙2009年1月25日除夕之夜,丫蛋因与赵本山、小沈阳等在央视春晚表演小品《不差钱》,一夜之间在全国……早孕厌油腻可食核桃和芝麻脂肪是动、植物油类的统称。它含热量最高,每克供给热能9千卡(每克蛋白质或糖仅产热4千卡)。如果把水分从脑中除净只剩下固体,那么,脂质约占脑重量的12。如果孕妇缺乏脂肪,会……天才学生的天才答案1。某次考试考语文,我的同桌在默词的时候突然灵感来了前句:问君能有几多愁要求补后句,他补了句:恰似一道红叉卷上留(原句:恰似一江春水向东流)老师毫不客气得在卷上打了个X他还沾沾……夜雨丨谷与麦拱破春天的土壤(外二首)拱破春天的土壤(外二首)谷与麦去年的羊和种子全都播种在我的小算盘里羊长大后,我驮运到集市一换成了三一头给了邻居的阿母一头还本……棉裤和保暖裤哪个暖和保暖裤怎么挑棉裤和保暖裤哪个暖和保暖裤更暖和。棉裤和保暖裤都是很好的保暖单品,但就保暖性比拼来说,如果是填充棉花的棉裤和驼毛羊绒面料的保暖裤谁更暖和,那自然是保暖裤更贴身保暖。……国有企业应该成为国家创新战略的引领者和践行者近年来,国家实施创新驱动发展战略,创新驱动发展不仅使科技创新取得历史性成就,也使我国经济由高速增长转向高质量发展。种种数据表明,国有企业过去和现在一直都是国家技术创新的主力军,……
额尔古纳河右岸一曲大自然纯粹的乐章,一首生命的挽歌丑闻!澳大利亚球迷拉横幅致敬希特勒赞美纳粹支持种族灭绝如果,你是一个性格内向的人,那么恭喜你在娄底,走进世界锑都冷水江,看特色乡村农庄发展朝礼千寺之683北京房山瑞云禅寺世界上最喜欢日本的地方是在哪呢?暗黑破坏神2MOD介绍亮剑演员现状有人成视帝有人负债上亿有人成鬼子专业户华为P50系列全球版将至,没有麒麟芯片,也没有鸿蒙系统开拓者巨星快当爹了!白富美孕妻晒近照,牙科女博士,人生赢家女排世锦赛日本3比0零封捷克,取得两连胜,古贺纱理那20分冠大衣哥家双喜临门本应祝贺,我却思虑他儿子的二次婚姻能走多远
你买过最穿不出去的衣服是什么样的?张力自助纯水机怎么样自助纯水机特点有哪些详解户型分析(全户型分析及最新进展曝光!)大班音乐活动谁是国王危桥属幽径,缭绕穿疏林。意思翻译、赏析熟练掌握这三点,人人都能写好文案女性不想被别人叫黄脸婆,4种水果尽量少吃初一军训心得作文字国庆长假,一起看看我们的田地养老储蓄到来,最高存20年,50万能变100万吗?80后该如qq个性签名成功哲理的句子唯美

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州