Home Page
cover of 模型
模型

模型

yujia zhang

0 followers

00:00-02:30

Nothing to say, yet

Voice Overspeechmusicnarrationmonologuemale speech

Audio hosting, extended storage and much more

AI Mastering

Transcription

We are about to do the most important thing, which is building a model. But before that, we need to understand what a model is. A model is what we seek, it predicts whether a movie will be a big hit or not. It can be in the form of an application, a website, or a small program. We have a part of the data with movies that were big hits and movies that weren't. We need to differentiate them to establish the logic for our model. Since there are many factors that influence whether a movie is a big hit or not, let's imagine we only have one feature, like budget. We divide the movies into high-budget and low-budget and analyze each group separately. In this case, we assume that high-budget movies are mostly big hits and low-budget movies are not. However, this assumption doesn't align with reality. We need more features to determine if a movie will be a big hit. For example, high budget, good director, good 接下来我们就要做最重要的事情 建立模型 但在这个问题之前 我们还有一个问题 那就是什么是模型 模型就是我们所求 能够预测电影是否大卖的成果 它的表现形式可以是个应用 可以是个网站 也可以是个小程序 我们都知道啊 数据中有一部分是大卖的电影 有部分是不大卖的电影 那我们如何区分它们 就是我们建立模型的逻辑 由于影响电影是否大卖的特性实在是太多了 想象一下 只有一个特征了 比如说预算成本 现在我们通过统计将预算成本 将电影分为两个部分 高预算电影和低预算电影 然后我们分别对这两部分电影进行统计 还记得我们做了一个数据标注了吗 所有电影是否大卖 我们都知道了 在这里啊 我们假设高预算电影都是大卖的 或者是大部分大卖的 而低预算电影都是不大卖的 这个和现实不太对照起来 大家先这样听一下 那么将来预算大的电影一进来 那模型就预测它是大卖的 但这个也仅在一个特征的情况下 更多的情况是预算多的电影 55%是大卖的 那么将来预测高预算电影 你预测它大卖 几率很高 你会翻车 所以带一个特征预算 无法左右一个电影是否大卖 我们需要更多的特征 这么说吧 高预算 好导演 好演员在合适时机上面上映 合适的题材的电影会大卖 这个也算是知识回归常识的一个说法了 那模型怎么建立呢 我们需要更多的特征 帮助我们去区分 不再是一个是多个 预算成本是否超一亿 将所有的电影分成两个部分 超一亿的和不超一亿的 然后再将这两部分电影通过新的特征继续分割 比如导演的知名度 随着划分越来越深入 到达一定条件就会停止划分 将这些电影进行一个统计 通过数据来统计成大卖或者不大卖 就如图所示 看到这个图 大家估计会很懵逼 和大家想象中的不太一样 不应该是整齐划分的吗 说的就是你 制作预算高就是大卖 你真的很特别啊 但是我知道你很急 但你先别急 还是那句话 你听不懂 就是我说的不好

Listen Next

Other Creators