Details
Nothing to say, yet
Details
Nothing to say, yet
Comment
Nothing to say, yet
The speaker explains how a model can be used to predict the success of movies based on data. The model considers factors such as budget and director's fame. However, there are limitations to the accuracy of these predictions. Factors like societal trends and audience preferences are hard to include in the model. Additionally, competition from other films and the limitations of AI and machine learning technology can affect the accuracy of predictions. 首先我把这张塑形图转化成一条条规则 这样大家看了可能更舒服了 在这里模型也可以认为是一条条通过数据总结出来的经验规则 我们已经知道了为什么大卖了 数据决定的 比如说低制作预算 导演知名度高的夏季电影就大卖 春秋冬就不大卖 因为夏季那波数据统计下来就是大卖的 其他统计下来就是不大卖的 那么将来再来一部夏季上映的知名导演的小制作预算电影 我们就会通过模型预测就会投资它 接下来我会自问自答一些问题 算是抛砖引玉 观众老爷如果听完还有疑问的 欢迎在评论区提问 第一个问题 什么时候开始统计大卖或者不大卖 怎么会有高有低的 怎么一个高预算就直接开始统计 并且统计成大卖了 这么豪横啊 首先统计的原则只有一个纯度 纯度够了就开始统计了 那纯度又是什么概念呢 纯度高代表着都是同一类别的电影 纯度低就代表着大部分都不是同一类别的 在这个例子中间只有两个类别 大卖电影和非大卖电影 结合一起来说 就是如果当前电影大都是大卖电影了 那就不必再分裂下去了 就直接统计得了 比如说高预算 高预算的电影都是大卖电影 还是那句话 这个可能和现实情况有一些出入啊 我们就拿这个例子说啊 就拿这个特性高预算来说都是同一类的 纯度够了 那都是大卖电影就不必再分裂了 开始统计了 这也是有高有低的原因 因为一旦纯度到了就不必再进行下去 开始统计了 那第二个问题如何统计 毕竟那个集合电影不一定全是大卖的 或者是全不是大卖的 衡量的标准是什么 它是按照百分比的 比如说电影集合中有70%的就是大卖了 那么我们就会把它统计成大卖 那么这个70%的预值是谁规定的呢 人为规定的第三个问题 预测结果一定是准确的吗 预测结果不一定是准确的 首先 即使是过去的电影的统计 都是按照百分比的 不是百分之百的 那更不要说将来的电影了 更深入的原因是 一质量差的数据可能会导致模型的质量差 在这里我没有讲数据特征模型的衡量标准 比如招回精确率等等 有兴趣的可以给我留言 我们可以再讲一期 第二点 电影的成功还受到很多不可预测的因素的影响 比如说社会热点 竞争电影的表现 突发事件等等 这些因素呢 其实很难纳入在模型当中 第三点 观众的兴趣和偏好 它是迅速变化的 它是难以预测的 比如说上一部电影的题材还是很受欢迎的 但是一旦到现在 那可能就变了 第四点 同期档的其他电影的表现 也会影响这部票房的成绩 那这种竞争效应啊 它是很难再预测和量化的 第五点 现有的AI和机器学习技术 在处理啊非常复杂多变量的预测任务时 可能还会存在一些的局限性和不确定因素