Explorez la filmologie
Utilisez la base de connaissances de Wolfram pour étudier le coût par minute et les recettes des films sortis depuis l'an 2000. En outre, explorez la durée moyenne de ces films qui, de manière inhabituelle parmi les objets fabriqués par l'homme, semble suivre une loi de distribution dite stable.
Utilisez une classe d'entités implicitement définie pour sélectionner les films sortis depuis le début du millénaire.
Length[movies =
EntityClass["Movie",
EntityProperty["Movie", "ReleaseDate"] ->
Between[{DateObject[{2000}], DateObject[{2015}]}]] // EntityList]
Récupérez les titres, les genres, les durées d'exploitation, les budgets de production et les recettes totales des films.
movieData =
EntityValue[
movies, {EntityProperty["Movie", "Name"],
EntityProperty["Movie", "Genres"],
EntityProperty["Movie", "Runtime"],
EntityProperty["Movie", "ReleaseDate"],
EntityProperty["Movie", "ProductionBudget"],
EntityProperty["Movie", "DomesticBoxOfficeGross"]}];
Le coût par minute d'un film diffusé est une fonction très fluctuante dans le temps.
Toutefois, si l'on fait la moyenne sur un mois, certaines périodicités du coût par minute deviennent visibles. En particulier, les lignes vertes de la grille indiquent le 4 juillet et les lignes violettes Thanksgiving dans le tracé suivant.
Comme le montre le tracé logarithmique suivant, les recettes au box-office par minute sont une fonction encore plus fluctuante.
La durée moyenne des films a été relativement constante au cours des 15 dernières années.
Si l'on regarde plus en détail, la répartition des durées d'exploitation des films semble relativement lisse.
movieRuntimes = DeleteMissing[movieData[[All, 3]]];
hg = Histogram[movieRuntimes, {1, 200, 5}, "PDF",
AxesLabel -> Automatic]
La modélisation à l'aide d'un grand nombre de lois intégrées indique que l'ajustement le plus proche est fourni par une loi stable de Lévy. Ici, les ajustements utilisant une loi normale (distribution des moyennes de variables aléatoires tirées indépendamment de distributions indépendantes), une loi log-normale (distribution du produit multiplicatif de nombreuses variables aléatoires positives indépendantes) et une loi stable sont calculés.
edNormal =
EstimatedDistribution[movieRuntimes,
NormalDistribution[\[Mu], \[Sigma]]]
edLogNormal =
EstimatedDistribution[movieRuntimes,
LogNormalDistribution[\[Mu], \[Sigma]]]
edStable =
EstimatedDistribution[movieRuntimes,
StableDistribution[1, \[Alpha], \[Beta], \[Mu], \[Sigma]]]
Il est intéressant de constater que la loi stable est visuellement la mieux adaptée.
Seuls quelques objets fabriqués par l'homme obéissent à une loi stable. L'une des caractéristiques d'une loi stable est l'apparition de valeurs aberrantes relativement importantes, souvent quelques fois plus grandes que la moyenne. Les films répondent à cette caractéristique. Ici, une classe d'entités implicitement définie est utilisée pour sélectionner les 10 films les plus longs (en termes de durée) sortis après le 1er janvier 2000.
longest =
EntityClass[
"Movie", {EntityProperty["Movie", "ReleaseDate"] ->
Between[{DateObject[{2000}], DateObject[{2015}]}],
EntityProperty["Movie", "Runtime"] -> TakeLargest[10]}] //
EntityList
Résumez dans une grille.