云尚制片管理系统

Data visualization is a key step of any data science project. During the process of exploratory data analysis, visualizing data allows us to locate outliers and identify distribution, helping us to control for possible biases in our data earlier on. Coupled with simple statistical tests, it can also answer many of the questions and can aid us in prioritizing areas to focus on.

数据可视化是任何数据科学项目的关键步骤。 在探索性数据分析过程中,可视化数据使我们能够找到异常值并识别分布,从而帮助我们尽早控制数据中可能存在的偏差。 结合简单的统计测试,它还可以回答许多问题,并可以帮助我们确定优先领域。

Here, I will go through some of the exploratory data analysis and data visualization steps in Python using Matplotlib and Seaborn libraries. The goal of the project is to analyze movie trends of the past decade to make suggestions in developing a new movie studio brand for a well-established corporation.

在这里,我将使用Matplotlib和Seaborn库完成一些探索性数据分析和数据可视化步骤。 该项目的目的是分析过去十年的电影趋势,为发展成熟的公司开发新的电影制片厂品牌提供建议。

方法 (Approach)

We explored the data with these two primary goals in mind.

考虑到这两个主要目标,我们探索了数据。

  1. Building a global brand — We don’t just make movies, we make good movies that appeal to a global audience.

    建立全球品牌- 我们不仅制作电影,而且制作吸引全球观众的优质电影。

  2. Establishing a sustainable long-term plan —Making a sustainable business plan, not just a movie production plan.

    建立可持续的长期计划- 制定可持续的商业计划,而不仅仅是电影制作计划。

数据结构 (Data Structure)

Our data frame structure
我们的数据框结构

This is the basic structure of our cleaned Pandas data frame. We sourced our data from the Movie Database (TMDB), IMDB, and the Numbers. I recommend using the Movie Database (TMDB) API for the preliminary movie data.

这是我们清理过的熊猫数据框的基本结构。 我们从电影数据库(TMDB),IMDB和数字中获取数据。 我建议使用电影数据库(TMDB)API来获取初步的电影数据。

勘探 (Exploration)

最初设定 (Initial Setup)

总收入分配 (Distribution of Gross Revenue)

Let’s start looking at the distribution of the overall gross revenues for domestic and worldwide. Seaborn’s distplot plots histogram along with KDE (Kernel Density Estimate) plot.

让我们开始看看国内和全球总收入的分布。 Seaborn的distplot绘制直方图以及KDE(内核密度估计)图

We can see that it is strongly right skewed, it is a pretty usual trend for income data. Taking the log transformation of this data can help us visualize what’s happening in the dense area more clearly.

我们可以看到它是非常右偏的,对于收入数据来说这是很常见的趋势。 对这些数据进行对数转换可以帮助我们更清晰地可视化密集区域中发生的情况。

Not surprisingly, It seems like the global market yields higher revenues on average. Let’s look at the relationship between the budget and revenue.

毫不奇怪,似乎全球市场平均产生更高的收入。 让我们看一下预算与收入之间的关系。

预算收入 (Budget to Revenue)

Now we want to visualize the relationship between production budget and gross revenue, which are two continuous variables using scatter plots. There are many ways to achieve this. Here, I used the overlaid scatter plots to look at the global and domestic gross revenues together.

现在我们要形象化生产预算和总收入之间的关系,这是使用散点图的两个连续变量。 有很多方法可以实现这一目标。 在这里,我使用叠加的散点图一起查看了全球和国内总收入。

It seems like a high budget does not always lead to high revenue especially in the domestic market. Also some movies yield high revenues with relatively lower budgets when it targets the global market. Let’s take a closer look at which genres might return the most return for its investment.

似乎高预算并不总是导致高收入,尤其是在国内市场。 此外,某些电影面向全球市场时,其预算却相对较低,可带来高额收入。 让我们仔细研究一下哪些类型的内容可能会为其投资带来最大的回报。

体裁分布 (Distribution of Genre)

We can look at the percentage of each genre in our dataset using a bar plot.

我们可以使用条形图查看数据集中每种类型的百分比

We see that about 30% of our data is action movies.

我们看到大约30%的数据是动作电影。

各类型的收益与成本比率 (Revenue to Cost Ratio of Each Genre)

Which genres have the highest return per investment?

哪种类型的单笔投资回报最高?

Based on the global gross revenue to budget ratio, horror films on average make the most return per investment. But this does not necessarily mean that horror movies bring the most profit. Horror movies might take less production budget to make, thus yielding a higher percentage of return per cost. We can compare the budget of each genre using a box plot.

根据全球总收入与预算的比率,恐怖电影平均每笔投资回报最高。 但这并不一定意味着恐怖电影会带来最大的收益。 恐怖电影可能需要较少的制作预算,因此产生更高的单位成本回报率。 我们可以使用箱形图比较每种类型的预算。

各类型的平均制作预算 (Average Production Budget of Each Genre)

As we suspected, horror movies usually require a little budget to start out. On the other hand, action, animation and some family films tend to have higher budgets. Then which genre of movies yield the most profit? (Here I’m using the term “profit” liberally to mean global gross revenue minus the production budget. In reality, we cannot entirely know what the total cost involved in the movie production, distribution and marketing is to validate this measure.)

正如我们所怀疑的,恐怖电影通常需要很少的预算才能开始。 另一方面,动作,动画和一些家庭电影往往预算较高。 那么哪种类型的电影收益最大? (在这里,我用“利润”一词来表示全球总收入减去制作预算。实际上,我们不能完全知道电影制作,发行和营销所涉及的总成本是如何验证这一指标的。)

各类型的利润 (Profit of Each Genre)

(code is similar to above)

(代码与上面类似)

In fact, the genre that usually yields the highest profit is animation, followed by family and action. We can also look at this relationship between production budget and gross revenue of each genre by plotting a linear model plot.

实际上,通常产生最高利润的类型是动画,其次是家庭和动作。 通过绘制线性模型图,我们还可以查看每种类型的生产预算与总收入之间的这种关系。

Looking at the linear model plot, it’s clear that with a very few exceptions, horror movies are low-cost and do not quite make a lot of revenues. Also high average profit for adventures seem to be from a handful of rare successes. It seems like feasible money-makers are action and animation. Action shows stronger correlation between budget and gross revenue, while animation seems to allow some of the high successes with relatively lower budget.

查看线性模型图 ,很明显,除了少数例外,恐怖电影是低成本的,并且收入不高。 冒险的高平均利润似乎也来自少数难得的成功。 似乎可行的赚钱活动是动作和动画。 动作显示预算与总收入之间的相关性更强,而动画似乎可以在预算相对较低的情况下取得一些成功。

We can simply compute correlations for each genre to confirm this.

我们可以简单地计算每种类型的相关性以确认这一点。

for g in df[‘genre’].unique():corr = df[df.genre == g][‘budget’].corr(df[df.genre == g][‘glob_gross’])print(f”{g}: {round(corr, 2)}”)# Action: 0.74# Animation 0.60# slightly higher correlation between global gross revenue and budget for action films.

But the profit is not everything. As a brand new studio, we want to build a reputation and elevate our brand image to level with other established studio brands. This requires making reputable and award-worthy movies, as well as popular movies that go viral. Let’s see which genre tends to earn this status.

但是利润不是一切。 作为一个全新的工作室,我们希望建立声誉并提升我们的品牌形象,使其与其他知名工作室品牌保持一致。 这就要求制作著名的和值得奖赏的电影,以及流行的流行电影。 让我们看看哪种流派倾向于获得这种地位。

等级 (Ratings)

A majority of horror movies don’t get high average ratings on IMDB, while biography or drama films tend to do well. We should investigate which type of biography or drama films are worth investing into. On the other hand, an all time winner seems like an animation, which often yields high revenue and high ratings. Only downside is that the award opportunities for animations are relatively slim.

大多数恐怖电影在IMDB上的平均收视率都不高,而传记或戏剧电影则表现良好。 我们应该调查哪些传记或戏剧电影值得投资。 另一方面,一个历来的赢家似乎就像一个动画,通常会带来高收入和高收视率。 唯一的缺点是动画的获奖机会相对较少。

人气度 (Popularity)

We can see that action, adventure and animation are the most popular genres, based on the TMDB popularity score, while comedy, horror and biography films tend to be less so. For building a global brand presence and high profit, action, adventure and animation are good areas to target. We will look at these three genres first.

根据TMDB的人气得分,我们可以看到动作,冒险和动画是最受欢迎的类型,而喜剧,恐怖和传记电影则不那么受欢迎。 对于建立全球品牌影响力和高利润而言,动作,冒险和动画是理想的目标领域。 我们将首先看这三种类型。

超级英雄动作片 (Superhero Action Films)

One thing that stood out from our dataset was that 3 out of 5 top profit action movies were superhero movies from Marvel production. Superhero film market has skyrocketed in the past decade and will be a difficult wall to break as a new studio, since most of them are sequels based on deep-rooted fandoms. So I decided to filter these superhero films based on the name of writers and directors by adding a new column ‘superhero’.

从我们的数据集中脱颖而出的一件事是,五部最赚钱的动作片中有三部是来自漫威制作的超级英雄电影。 在过去的十年中,超级英雄电影市场飞速发展,作为一个新的制片厂,这将是很难打破的一堵墙,因为其中大多数都是基于根深蒂固的狂热分子的续集。 因此,我决定根据作者和导演的姓名来过滤这些超级英雄电影,方法是添加一个新列“ superhero”。

Swarm plot is a good way to look at distribution of continuous values based on two other categorical values. Here, we can see that a big chunk of high profit action movies are indeed superhero films. Also even though not depicted here, most of successful non-superhero films are sequels (for both action and animation). It might be worthwhile to add a sequel as a feature for more deeper analysis.

Swarm图是查看基于其他两个分类值的连续值分布的好方法。 在这里,我们可以看到大量的高利润动作电影确实是超级英雄电影。 同样,尽管这里没有描述,但大多数成功的非超级英雄电影都是续集(用于动作和动画)。 可能需要添加续集作为更深入的分析功能。

动作,动画,冒险 (Action, Animation, Adventure)

We can see here that animation on average tends to be more successful globally and domestically.

我们在这里可以看到,动画在全球和国内平均而言更趋于成功。

获奖电影 (Award Winning Films)

So far we established that given a high budget, animation is perhaps a less risky genre to invest in. But we also want to invest in non-animation films to expand our chance of winning awards and establishing the reputation. Earlier we saw that biography and drama films tend to get rated high.

到目前为止,我们已经确定,在预算较高的情况下,动画可能是投资风险较小的类型。但是,我们也希望投资于非动画电影,以扩大获得奖项和建立声誉的机会。 之前我们看到传记和戏剧电影的收视率往往很高。

This plot shows that generally higher rating is associated with higher profit, but not by much. Also there seems to be some drama films that are following a different trend. We should look more into the sub-genre of drama films.

该图表明,较高的评级通常与较高的利润相关,但关系不大。 似乎有些戏剧电影也遵循不同的趋势。 我们应该更多地研究戏剧电影的子流派。

Strip plot is a scatter plot for categorical value, which adds a bit of horizontal jitter making it easier to visualize the density of values. It’s hard to observe strong trends here as there are too many categories and not enough observation, other than that there many of the drama films have a sub-genre of romance.

带状图是分类值的散点图,它增加了一些水平抖动,从而更易于可视化值的密度。 在这里很难观察到强烈的趋势,因为类别太多,观察不够,除了许多戏剧电影都具有浪漫的亚体。

Simple t-test showed that there are statistically significant differences in average IMDB rating between drama and biography films (p < 0.01), but not in profit or budget. So we should focus on making a biography film instead.

简单的t检验表明,戏剧电影和传记电影之间的IMDB平均评分存在统计学差异( p <0.01 ),但利润或预算上没有差异。 因此,我们应该专注于制作传记电影。

每月趋势 (Monthly Trend)

Lastly, we looked at when is the best time to release the movie to maximize the profit using line plots.

最后,我们用线图研究了何时发行电影以最大化利润的最佳时间。

Looking at the annual trend, we can see that movies released in April to June tend to be the highest revenue yielding. This would be a great time to release our globally appealing animation.

从年度趋势来看,我们可以看到4月至6月发行的电影收益最高。 这将是发布我们具有全球吸引力的动画的绝佳时机。

Highly acclaimed movies are released close to the end of the year during the “Oscar Seasons” to maximize their exposures to critics. We recommend releasing our award worthy biography films during this time and elevate our brand to the level of other established studios.

备受赞誉的电影将在“奥斯卡季”(Oscar Seasons)临近年底发行,以最大程度地提高对评论家的曝光率。 我们建议您在这段时间内发布我们的获奖传记电影,并将我们的品牌提升到其他知名制片厂的水平。

结论 (Conclusion)

We reviewed the movie data from the past decade to propose a few recommendations and guidelines to start a movie studio. Horror movies yield the highest percentage return per investment and it requires a little budget to start out. But it’s not a good genre to start with, as it is usually not popular or highly rated, and does not bring in high revenue. To maximize the profit and to develop global presence, investing in animation films is encouraged. As well to target awards, in order to elevate the brand reputation, we suggested making biography films. An annual plan to synergize productions of two separate lines of films (profitable animation and award-worthy biography) is suggested.

我们回顾了过去十年的电影数据,提出了一些建议和指导方针来建立电影制片厂。 恐怖电影的单笔投资回报率最高,而且制作预算也很少。 但这并不是一个很好的类型,因为它通常不受欢迎或评级很高,并且不会带来高收入。 为了最大化利润并发展全球影响力,鼓励在动画电影上投资。 除了获得奖项之外,为了提升品牌声誉,我们建议制作传记电影。 建议制定一项年度计划,以使两行不同的电影(有益的动画和获奖的传记)的制作相互协调。

For a more in depth process, you can check out the Github page here. This project was a collaboration done in collaboration with my colleague Paul Torres.

有关更深入的过程,您可以在此处查看Github页面。 这个项目是与我的同事Paul Torres合作完成的。

翻译自: https://medium.com/swlh/future-of-a-movie-studio-29a65fcf48c

云尚制片管理系统


http://www.taodudu.cc/news/show-994860.html

相关文章:

  • t-sne原理解释_T-SNE解释-数学与直觉
  • js合并同类数组里面的对象_通过同类群组保留估算客户生命周期价值
  • com编程创建快捷方式中文_如何以编程方式为博客创建wordcloud?
  • 基于plotly数据可视化_如何使用Plotly进行数据可视化
  • 用Python创建漂亮的交互式可视化效果
  • php如何减缓gc_管理信息传播-使用数据科学减缓错误信息的传播
  • 泰坦尼克号 数据分析_第1部分:泰坦尼克号-数据分析基础
  • vba数组dim_NDArray — —一个基于Java的N-Dim数组工具包
  • python算法和数据结构_Python中的数据结构和算法
  • python dash_Dash是Databricks Spark后端的理想基于Python的前端
  • 在Python中查找子字符串索引的5种方法
  • 趣味数据故事_坏数据的好故事
  • python分句_Python循环中的分句,继续和其他子句
  • python数据建模数据集_Python中的数据集
  • usgs地震记录如何下载_用大叶草绘制USGS地震数据
  • 数据可视化 信息可视化_更好的数据可视化的8个技巧
  • sql 左联接 全联接_通过了解自我联接将您SQL技能提升到一个新的水平
  • 科学价值 社交关系 大数据_服务的价值:数据科学和用户体验研究美好生活
  • vs azure web_在Azure中迁移和自动化Chrome Web爬网程序的指南。
  • selenium 解析网页_用Selenium进行网页搜刮
  • hive 导入hdfs数据_将数据加载或导入运行在基于HDFS的数据湖之上的Hive表中的另一种方法。
  • 大数据业务学习笔记_学习业务成为一名出色的数据科学家
  • python 开发api_使用FastAPI和Python快速开发高性能API
  • Power BI:M与DAX以及度量与计算列
  • 梯度下降法优化目标函数_如何通过3个简单的步骤区分梯度下降目标函数
  • seaborn 子图_Seaborn FacetGrid:进一步完善子图
  • 异常检测时间序列_时间序列的无监督异常检测
  • 存款惊人_如何使您的图快速美丽惊人
  • 网络传播动力学_通过简单的规则传播动力
  • 开源软件 安全风险_3开源安全风险及其解决方法

云尚制片管理系统_电影制片厂的未来相关推荐

  1. 计算机制片管理系统,Agile Shot:新一代影视制片流程管理系统大揭秘

    原标题:Agile Shot:新一代影视制片流程管理系统大揭秘 制片管理是影视行业的一个重要概念.一个剧组小到几十人,大到成百上千人,涉及的工作领域非常宽泛,工作纷繁复杂,制片管理贯穿影视生产的全过程 ...

  2. 生鲜配送ERP系统_对商品模块数据模型与界面设计的思考【Java 开源版】杭州生鲜配送系统_升鲜宝_SaaS全链路生鲜供应链管理系统_升鲜宝

    生鲜配送ERP系统_对商品模块数据模型与界面设计的思考及简要分析[Java 开源版]杭州生鲜配送系统_升鲜宝_SaaS全链路生鲜供应链管理系统_升鲜宝 一直在研究与改造自己的生鲜配送系统,越来越觉得后 ...

  3. 尚医通_第1章-项目简介

    尚医通_第1章-项目简介 文章目录 尚医通_第1章-项目简介 二.业务流程 三.系统架构 一.功能简介 尚医通即为网上预约挂号系统,网上预约挂号是近年来开展的一项便民就医服务,旨在缓解看病难.挂号难的 ...

  4. 药品进销存管理系统_药一点软件_连锁版介绍符合GSP最新要求

    药品进销存管理系统_药一点软件_连锁版介绍符合GSP最新要求 ● 各证照到期预警及自动过期停用,首营企业.品种及不合格药品管理等等...... ● 全国多个地区药监部门推荐本产品并顺利通过GSP检验 ...

  5. 云尚,大健康时代的共享经济实践

    注意该文不是广告也不是软文,只是在讲述一件互联网转型的案例. 共享经济不仅是在做加法,更是在做乘法,以此可以有效降低创业创新门槛,实现闲置资源充分利用,形成新的增长点,为经济注入强劲动力.此外,共享经 ...

  6. 2021-2027全球与中国患者管理系统市场现状及未来发展趋势

    2021-2027全球与中国患者管理系统市场现状及未来发展趋势 本文研究全球及中国市场患者管理系统现状及未来发展趋势,侧重分析全球及中国市场的主要企业,同时对比北美.欧洲.日本.中国.东南亚.印度等地 ...

  7. 基于SpringBoot健身房管理系统_计算机毕业设计_源码分享

    本次推荐的是健身房管理系统,此系统包含了会员管理.教练管理.课程管理.器材管理.物品遗失管理.商品管理以及信息统计等七大功能模块.项目文件结构完整,代码条理清晰.非常适合学习仿写以及二次开发.图片以及 ...

  8. 五、云尚办公-菜单管理

    云尚办公系统:菜单管理 B站直达[为尚硅谷点赞]: https://www.bilibili.com/video/BV1Ya411S7aT 本博文以课程相关为主发布,并且融入了自己的一些看法以及对学习 ...

  9. 故障模块名称kernelbase.dll_固定资产管理系统_资产分类名称(通讯导航有线电及测量仪器篇)...

    大家好,今天小编来给大家讲解一下固定资产管理系统中的资产分类模块包含的与通讯导航有线电及电视用测量仪器相关的固定资产分类名称. 1.通讯.导航测试仪器:载波通讯测量仪器.微波通讯测量仪器.收发讯机测试 ...

最新文章

  1. HTML fieldset 标签 -- 表单分组
  2. 谨慎使用PHP的引用
  3. TypeError: new(): data must be a sequence (got float)
  4. python能爬视频吗_Python爬取视频(其实是一篇福利)
  5. mysql 执行计划不对_mysql tokudb执行计划走的不准确案例
  6. android6.0/7.0禁掉Selinux
  7. 在IDEA中进行开发时,Maven的插件或依赖显示红线的问题
  8. ubuntu端口转发工具 Rinetd
  9. 第一弹app v2.30.0
  10. Firefox书签同步工具Xmarks
  11. log4j和slf4j的区别
  12. RFID图书馆藏书防盗安全门门禁系统的应用分析
  13. URLDownloadToFile缓存问题
  14. 【毕业设计】深度学习图像风格迁移算法研究与实现 - python 卷积神经网络
  15. 【SAP-CO】CO模块主要子模块相关概念
  16. 【第93期】谁是元宇宙的“基础设施”?
  17. 网站域名未备案可以使用奇安信网站卫士吗?
  18. 手把手教你R语言做k均值聚类分析
  19. html文件的模板分离,JS数据模板分离(告别字符串拼接)-template
  20. What? 少儿编程语言Scratch被禁!

热门文章

  1. 判断一段文件是UTF-8编码还是GB2312的编码方式
  2. 计算机网络【五】广播通信+以太网
  3. C++ 类模板二(类模版与友元函数)
  4. 韦东山衔接班——4.4_构建根文件系统之构建根文件系统
  5. Docker学习笔记 - Docker Compose
  6. 【CZY选讲·Yjq的棺材】
  7. 将Session写入Memcache
  8. hyper虚拟机下对centos进行动态扩容
  9. jquery 实现智能炫酷的翻页相册效果
  10. [转载]C#中,让组合框(ComboBox)支持拼音首字母检索筛选