Téléchargement AI Job Info - Téléchargement du code source AI Job Info

AI-Job-Info

Mettre à jour les dernières expériences de stage et d'entretien dans les grandes sociétés Internet

Dernière mise à jour : 2019/10/25

Auteur : @Computer Vision Alliance, @Sophia-11, @forward this Beyond Sister, @水一水, @EternityY, @小安run ! ! , @un revers en 1,3 milliard, @工大菜鸡, @maycbj

Journal de mise à jour

2019/08/21 - Catalogue mis à jour

2019/09/05 - Ajout de 9 unités

2019/09/21 - Mettre à jour les informations sur l'auteur

2019/10/11 - Mise à jour de plus de 10 sutras du visage

2019/10/25 - Mise à jour de l'Alibaba Damo Academy

Table des matières

1. Aperçu général de Huawei, DJI, Toutiao, Alibaba, Baidu, Alibaba, Tencent, JD.com et Xiaomi
2. Entretien de stage 2020 sur l'algorithme de vision par ordinateur Tencent pour le baccalauréat et la maîtrise 985 diplômes de maîtrise non majeurs
3. Entretien de stage d'été Baidu Computer Vision
4. Entretien de stage JD Computer Vision
5. Oppo approuve à l'avance les entretiens d'embauche C++
6. Midea approuve à l'avance les ingénieurs d'exploration de données Python
7. Stagiaire en algorithme d'image chez Momo Technology
8. Trois aspects du front-end de Baidu
9. Cambrian : ingénieur en apprentissage profond
10. Page d'accueil 2019.7.24
11. Baidu
12. Tencent
13. Pinduoduo2019.8.13
14. Rue Mogu 2019.8.14
15. Développement de jeux NetEase Interactive Entertainment
16. Recherche 360 (classement) - Ingénieur en apprentissage automatique
17. NetEase Internet : ingénieur en apprentissage profond
18. SF Express sp et ventes spéciales ihandy pour les clients bovins
19. Didi Niuke sp session spéciale
20. Kuaishou Niuke sp session spéciale
21. Yitu
22. Tencent
23. Vision
24. Baidu
25. Sogou
26. OPPO
27. 58 dans la même ville
28.Huawei
29. Académie Alibaba Damo
Remarques
- 001

1. Aperçu général de Huawei, DJI, Toutiao, Alibaba, Baidu, Alibaba, Tencent, JD.com et Xiaomi

Huawei :

Huawei est une entreprise plus décontractée et relativement simple.
Il y a deux séries d'entretiens. Les deux tours se déroulent généralement ensemble. Si vous réussissez un tour, vous irez dans une autre salle pour le deuxième tour.
En général, des milliers de personnes passent un entretien. Même si cela est relativement facile, la concurrence reste élevée et il faut bien se préparer.

DJI :

DJI est absolument une entreprise dont tout le monde rêve, et bien sûr la concurrence est assez rude.
Il y a au total quatre séries d'entretiens : une : test de personnalité ; deux : test écrit, les questions portent sur des sujets plus professionnels, si l'algorithme est plus mathématique et les détails de programmation et la capacité de mise en œuvre ; troisième tour : entretien téléphonique; quatrième tour : téléphone ; ou entretien sur place
Le premier tour d'entretiens est simple et il y a très peu de personnes interrogées. Après le deuxième tour, le niveau de difficulté augmente. Habituellement, la moitié des personnes peuvent être interrogées après le deuxième tour. . Par conséquent, si vous souhaitez rejoindre DJI, vous devez être parfaitement préparé.

Les gros titres du jour :

Trois séries d'entretiens techniques, entretiens vidéo à distance, chaque série dure moins d'une heure
Chaque tour posera des questions sur les projets de programmation et d'algorithmes
Concentrez-vous sur les compétences pratiques en programmation

Alibaba :

4 séries d'entretiens techniques + 1 série d'entretiens RH
Examiner les projets et les capacités de programmation
Le Round 4 peut vous permettre de partager la programmation d'écran en ligne

Baidu :

Concentrez-vous sur les détails fondamentaux et l’étendue de la programmation
Reproductibilité de la programmation et capacités de mise en œuvre technique

Tencent :

Si vous avez un stage, une offre vous sera proposée si vous réussissez l'évaluation de fin de stage (c'est ce que fait mon ami)
Sans stage, il n'y a que 3 tours d'aspects techniques. Vous portez une grande attention aux détails et pouvez vous permettre d'analyser des problèmes d'algorithmes sur place.

JD.com :

Formules poussées à la main, axées sur la capacité mathématique
L'ami de l'éditeur a interviewé pour JD.com, mais a été rejeté en raison de la formule poussée à la main.
Il reste donc à déduire les algorithmes classiques, et pour y faire face, il faut aussi être capable de

Millet:

Renseignez-vous sur place sur l'expérience du projet et les capacités de l'algorithme
Ceux qui se rendront à Wuhan cette année bénéficieront du même salaire et des mêmes avantages sociaux que ceux de Pékin, ce qui peut être considéré comme très généreux.

2. Entretien de stage 2020 sur l'algorithme de vision par ordinateur Tencent pour le baccalauréat et la maîtrise 985 diplômes de maîtrise non majeurs

J'ai un baccalauréat et un master de 985 (l'école a un classement inférieur). Je n'ai pas de formation en informatique et j'ai fait des projets de CV connexes, je me sens un peu coupable, mais le patron a dirigé. plusieurs concours.

Poste d'entretien

Emplois chez Tencent Algorithme de vision par ordinateur

Rappel global du contenu de l'entretien, quel que soit l'entretien qui a eu lieu

Quel que soit l'entretien dont il s'agit, vous vous présenterez toujours en premier, décrirez vos points forts pendant une minute et mentionnerez parfois brièvement votre point de vue sur les points faibles.

Doit poser des questions :

Avez-vous participé à des stages pertinents, quels projets avez-vous réalisés, à combien de matchs avez-vous joué et à quels postes avez-vous occupé ? En me concentrant sur un jeu que je connais, j'expliquerai en détail les principes de l'algorithme et l'analyse des résultats du jeu. Si je rejoue au jeu la prochaine fois, comment améliorer mon classement. Quel est le gain en jouant au jeu ? Selon vous, quelle est la différence entre l’industrie et la recherche scientifique ?

Questions de programmation :

(J'ai écrit C++ et Python)
Concernant les problématiques C++, je ne m'en souviens que de celles-ci, et je ne suis pas membre plénier....
Quelle est la différence entre vecteur, liste et carte ?
Références et pointeurs
Enjeux polymorphes, héritage, construction et destruction
C++ 11 donne quelques exemples de nouvelles fonctionnalités et de celles que vous avez utilisées
Pensez-vous que l’automobile est pratique ?
fonction virtuelle
Allocation de mémoire (explication de la différence entre tas et pile)
Python questionne la fonction lambda, comment opérer la conversion de type

Problèmes liés à l’algorithme CV et à l’apprentissage automatique

Lequel de YOLO V2 V3 connaissez-vous ? Parlons des détails de mise en œuvre.
problème multi-échelle
Connaissance de base de l'ancre
Algorithmes couramment utilisés pour la reconnaissance faciale maintenant
Comment effectuer une segmentation sémantique en segmentation d'instance
Comprenez-vous le GAN et comment expliquer ses principes de manière populaire ?
Principe PCA Principe LDA
SVM+PORC
XGBoost
CNN, RCNN, FRCNN, on vous demandera peut-être la clé de l'un des détails
Que pensez-vous de ces frameworks TensorFlow et de votre compréhension des autres frameworks ?
L’apprentissage automatique et l’apprentissage profond sont si populaires actuellement, qu’en pensez-vous ?
Quelle est votre compréhension de l’apprentissage automatique et de l’apprentissage profond ?
Étapes et clés pour effectuer la reconnaissance du numéro de maison ou de la plaque d'immatriculation
La raison pour laquelle Relu est plus utilisé que Sigmoïde
La raison pour laquelle la perte n'augmente pas mais diminue, et comment la résoudre
Détails du SSD
La signification des autorisations Linux
Étapes et raccourcis pour les opérations de bloc
rm -rf *Que signifie cette phrase ?

3. Entretien de stage d'été Baidu Computer Vision

arrière-plan:

Master 985 ordinaire, mais sans aucune recommandation interne, j'ai reçu l'offre de stage d'été Baidu CV

Note globale :

Ce n'est pas trop difficile, les intervieweurs sont très sympas, il y a trois séries d'entretiens, des projets sur base de CV, et puis on commence à s'élargir.

Un côté : (environ 35 minutes)

1. Présentez-vous d’abord
2. De quelle partie du projet sur votre CV êtes-vous responsable, quelle partie de l'algorithme a été mise en œuvre et quel est votre niveau de contribution ?
3. Comment mettre en œuvre la détection de cible et comment l’optimiser ? Comprenez-vous l’histoire de la reconnaissance des cibles ?
4. Quelle est la différence entre l’apprentissage automatique et l’apprentissage profond ? Quelle est votre opinion ?
5. Quels sont les paramètres internes et externes pour l’étalonnage de la caméra ?
6. Veuillez parler du principe de SVM
7. Comment voyez-vous la question des heures supplémentaires ? Connaissez-vous la culture Baidu ?
8. Comment étudiez-vous habituellement et quels livres et vidéos lisez-vous ?
9. Parlons de NMS et de soft-NMS
10. J'ai posé une question originale sur leetcode, mais j'ai oublié o(╥﹏╥)o
11. Comprenez-vous les fonctionnalités de C++11 et pourquoi est-il pratique d'utiliser auto. Veuillez donner un exemple ?
12. Héritage de classe, différences de pile et scénarios applicables

Résumé : Mon frère suggère de se concentrer sur la recherche de certains algorithmes sous-jacents, structures de données, arbres de décision et méthodes de mise en œuvre d'algorithmes de traitement d'image courants.

Deux faces : (40min)

1. Parlez du projet en détail. Mon frère devrait en savoir beaucoup sur le projet. J'ai posé des questions sur les paramètres, les idées et les techniques, ainsi que sur les plus grandes difficultés rencontrées et comment les résoudre.
2. Principes de SVM et KNN
3. Quel est le dernier article que j'ai appris récemment, quel algorithme-cadre a été utilisé et quel type d'effet a été obtenu ?

Résumé : Fondamentalement, toutes les questions des deux côtés concernent le projet, et les autres questions doivent se concentrer davantage sur vos idées pour résoudre les problèmes et analyser les erreurs de votre projet.

Trois côtés : (30min)

1. Présentez-vous et quels sont vos points forts ?
2. Parlons de la fonction de perte
3. Quels sont les algorithmes de reconnaissance faciale ? Lequel connaissez-vous le mieux ? Parlons de la façon de le mettre en œuvre ?
4. Quelles offres existe-t-il actuellement en dehors de Baidu, et laquelle préférez-vous ?
5. Quand puis-je faire un stage ? Dans quelle direction souhaitez-vous faire ?
6. Avez-vous quelque chose à demander ?

Résumé : Les enquêteurs sont relativement professionnels et n'ont pas d'air. Ne faites pas semblant de comprendre. Si vous ne savez pas, dites simplement non.

4. Entretien de stage JD Computer Vision

un côté

SVM poussé à la main : la distance entre un point de l'espace et l'hyperplan, la fonction de coût globale du SVM, s'il est double.
Fonction de perte LR, comment optimiser
Après une convolution multicouche du réseau Inception, s'agit-il d'une concaténation ou d'un ajout pixel par pixel ?
Signification du réseau Xception
La signification de ResNet et DenseNet, méthode de traitement, quels sont les avantages, en particulier l'addition concaténée ou pixel par pixel
Formule mathématique Softmax pour la classification des réseaux neuronaux, comment la calculer
Définition de la fonction de perte d'entropie croisée, exemple de processus de calcul
J'ai conçu ces réseaux moi-même
Que sont les petits réseaux ?
Comment les réseaux de neurones accélèrent

Deux côtés

Discutez d'articles et de projets
Comment mettre en œuvre la détection de ligne de voie et la détection de bord
Processus de base du réseau de reconnaissance du comportement
L’effet de la classification binaire est-il meilleur que celui de la multi-classification ?
Comment effectuer deux classifications
Comment distinguer les cas difficiles
Qu'est-ce que le surapprentissage, comment le résoudre et contre-mesures
Comment résoudre le surapprentissage du point de vue de la structure du modèle
Quelle est la différence entre L1 et L2 et à quels scénarios conviennent-ils ?
Pourquoi ne pas utiliser L0
Pourquoi L1 n'est pas utilisé dans les réseaux de neurones convolutifs
Comment la masse graduelle est générée et comment la résoudre

5. Oppo approuve à l'avance les entretiens d'embauche C++

Auteur : transmettre ceci au-delà de ma sœur

15 minutes par face :

La différence entre tas et pile
La différence entre les pointeurs et les références
c copie profonde copie superficielle
Qu’est-ce qu’une fuite de mémoire et comment la vérifier ?
Quelle est la complexité temporelle du tri à bulles
Le projet a posé quelques questions supplémentaires. ##23 minutes pour les deux côtés :
Présentez le projet, le contexte et les rôles du projet, comment résoudre les plus grandes difficultés et quels sont les gains blabla
Dites-moi les étapes pour une file d'attente rapide
Combien de nœuds y a-t-il au niveau n d’un arbre binaire complet ?
Demandez le contenu de chaque CV un par un, qu'avez-vous principalement fait pendant le stage et qu'avez-vous gagné ? Avez-vous rencontré des difficultés en tant que directeur du séminaire ? Quels sont les avantages d’être chef de classe ? J'ai également demandé d'autres choses sur mon CV.* Quoi qu'il en soit, je les ai posées très soigneusement.
Quelle classe préférez-vous ? Pourquoi?
Comment est votre capacité d’apprentissage ?

25 minutes pour trois faces :

Trois côtés : Parler de la vie. Mais je sens qu'il y a un écueil, il demande quel est le salaire attendu ? Plus tard, j'ai découvert que j'en avais trop peu parlé, et pouah, je me suis évanoui à force de pleurer. . . .

6. Midea approuve à l'avance les ingénieurs d'exploration de données Python

Auteur : Shui Yi Shui

Questions d'entretien :

1. Réponse d'auto-introduction : Une vague d'opérations de routine, informations de base + capacité technique + soft power.

2. Parlez-nous des concours ou des projets auxquels vous avez participé ? Réponse : L'affiche parlait d'un concours.

3. Qu'est-ce qui est généralement utilisé pour les modèles d'image ? Réponse : L'affiche indiquait qu'il utilisait principalement des réseaux de neurones profonds et parlait d'un projet.

4. Quels modèles connaissez-vous en matière d’apprentissage profond ou d’apprentissage automatique ? Réponse : L'affiche originale mentionnait resnet dans le projet via l'apprentissage profond. Dans l'apprentissage automatique, les concours utilisent généralement lgb et xgb, et certains utilisent également LR, j'ai également utilisé lsmt, rnn et autres dans un concours précédent. adapté à ce type de compétition. Le langage naturel fonctionne mieux.

5. Quelles bases de données avez-vous utilisées ? Réponse : Je ne l'utilise pas beaucoup. J'ai utilisé la base de données RDS d'AWS, mais j'ai appris toutes les instructions SQL.

6. Il existe maintenant une table qui vous permet d'insérer et de mettre à jour. Comment utiliser SQL pour l'implémenter ? Réponse : insérer et mettre à jour.

7. Ce que vous venez de dire, ce sont deux déclarations. Comment le mettre en œuvre avec une seule déclaration ? Réponse : Je suis resté vide pendant un moment et je n’y ai vraiment pas pensé. L'intervieweur a dit que vous ne l'utilisiez peut-être pas souvent. J'ai dit oui, la base de données n'est généralement pas grande et l'exigence relative au nombre de déclarations n'est pas très stricte.

8.Quelle langue parlez-vous principalement ? python? Réponse : Eh bien, j'utilise Python plus récemment, mais le projet auquel je viens de m'inscrire a en fait été réalisé en C++.

9.Quels packages Python utilisez-vous principalement ? Réponse : Sklern, numpy, pandas et matplotlib pour dessiner des images, je me suis senti lent pendant un moment et je ne pouvais penser à rien d'autre.

10.A quoi sert l’indice des pandas ? Réponse : Les données sont ajustées, ce qui ressemble un peu à la clé primaire de la base de données (je ne pense pas avoir bien répondu à cette question, je ne sais pas si l'enquêteur l'a remarqué...)

11. Quelles questions avez-vous à me poser ? Réponse : Ce poste nécessite-t-il des compétences élevées en ingénierie ? Ou cela nécessite-t-il des capacités algorithmiques élevées ? L'intervieweur a dit que vous n'étiez pas obligé de me suivre. Je viens d'être organisé pour une interview par le groupe. L'auteur s'est senti un peu gêné. Ensuite, l’intervieweur a déclaré que l’algorithme devait de toute façon être mis en œuvre. Ensuite, l'affiche posait une autre question, c'est-à-dire qu'en postulant pour un poste, j'ai découvert qu'il y avait deux départements, un département informatique de groupe et un Meiyun Intelligent Data. Y a-t-il une grande différence entre occuper ce poste dans ces deux départements ? L'intervieweur a répondu pendant un moment. . .

7. Stagiaire en algorithme d'image chez Momo Technology

Auteur : EternityY

un côté

Diagramme de structure de réseau du document
Comment l'algorithme de flux optique implémente un flux optique dense et comment trouver des points adjacents
Réseau de reconnaissance de comportement, échantillonnage clairsemé
Principe d'abandon
Principe Kmean
Principe de l'arbre de décision
Principe du BN, pourquoi utiliser le BN
Combien de paramètres le réseau Xception peut-il réduire et pourquoi peut-il atteindre une grande précision ?
Matrice de transformation affine, matrice de transformation de perspective, interpolation bilinéaire
Cas : Comment extraire des actions de haute qualité et de merveilleux retours d'images des utilisateurs

Deux côtés

Formation multi-cartes TF, un modèle ne peut pas tenir sur une seule carte, comment l'exécuter sur plusieurs cartes
Comment la convolution est-elle calculée dans TF ?
Comment effectuer une convolution transposée dans TF
Comment calculer le champ récepteur de convolution dilaté
Question d'algorithme : toutes les chaînes de la chaîne proviennent-elles du dictionnaire ?
Fusionner les listes chaînées K

trois côtés

Formule d'entropie croisée, pourquoi l'entropie croisée peut être utilisée dans la classification
Fonction Softmax
Historique de l'évolution du Deeplab
Quelle est la différence entre Deeplabv2 et DeeplabV3
Quelles nouvelles théories la V3 propose-t-elle ?
Comment résoudre des changements d’échelle drastiques
Segmentation sémantique vitesse de traitement d'image à une image
Vitesse de traitement Xception
Vitesse de traitement ResNet
Quelle est la partie la plus chronophage du réseau neuronal convolutif ?
Avez-vous une expérience dans la mise en œuvre de l'algorithme lui-même (le point clé est que l'auteur n'a publié que des articles et que le laboratoire n'a aucun projet de coopération avec l'entreprise)

8. Trois aspects du front-end de Baidu

Auteur : Xiaoan, cours ! !

Un côté2019/7/29

(1) La différence entre WeChat Mini Program et Vue (car il existe un projet pour créer WeChat Mini Program)

(2) principe vuex de communication entre les composants Vue

(3) Nouvelles fonctionnalités couramment utilisées de ES6

(4) cartographier et définir les structures

(5) Promesse de demande asynchrone et attente asynchrone

(6) Dessiner un triangle en utilisant le principe de l'équipartition

(7) Dessinez une forme d'éventail

(8) Animation de mise en œuvre de l'animation et requestAnimationFrame

(9) Connaissez-vous la demande de récupération d'options de pré-requête ? Interdomaine

(10) sécurité Internet

(11) Quelle est la taille des pixels physiques et des pixels logiques tels que 1 px sur l'écran ?

(12) attribut de taille de boîte

(13) La différence entre TCP et UDP

(14) Comprenez-vous la traversée d'arbres binaires ? Comment parcourir avec la traversée de précommande. . .

2019/8/2 Deux faces

(1) En présentant le projet, Balabala a beaucoup posé de questions sur les difficultés rencontrées (la solution utilisait setTimeout, donc les Promise et Async/await suivantes ont été étendues)

(2) Certaines fonctionnalités d'ES6 et une différence entre les méthodes de tableau ES6

(3) À quoi ressemble la valeur clé de la structure Set (peu clair)

(4) Existe-t-il un autre moyen de dédupliquer des tableaux que Set ?

(5) Que sont les opérations asynchrones ? Promesse et Async/attendre

(6) Utilisez Promise pour encapsuler les requêtes Ajax en appelant cette méthode pour obtenir les données demandées via .then()

(7) Quelles sont les modalités d'envoi des demandes ? Comme l'Ajax

(8) Cross-domain : Pourquoi y a-t-il cross-domain ? Quelle est la même politique d’origine ? Comment résoudre un problème inter-domaines ? Les ressources peuvent-elles être partagées entre le domaine parent et le sous-domaine ?

(9) Avez-vous déjà réalisé un projet de terminal mobile ? (Je l'ai fait mais je l'ai oublié) Comment s'adapter au terminal mobile

(10) Swiper et animation de terminal mobile (je me suis creusé un trou. Au départ, je voulais en parler avec désinvolture, mais il s'est avéré qu'ils fonctionnent principalement sur les terminaux mobiles) Comment obtenir l'effet de glisser vers le haut pour afficher la page suivante sans utiliser le plug-in swiper ? Quels événements sont disponibles sur mobile ?

(11) Comment obtenir les paramètres d'URL de la page

(12) Mécanisme de délégation d'événements

En fait, le deuxième entretien pose principalement des questions basées sur ce que vous avez fait sur votre CV et les points de connaissances impliqués dans vos réponses.

2019/8/6 Trois côtés

(1) Présenter un projet en termes de contexte du projet, de raisons de mise en œuvre, d'effets de mise en œuvre et de problèmes rencontrés. Après avoir parlé pendant un long moment, j'avais l'impression de manquer de mots et de ne pas pouvoir expliquer clairement, alors j'ai changé de sujet.

(2) Quand avez-vous commencé à apprendre le front-end et pourquoi vous en tenez-vous toujours à la direction front-end.

(3) Qu'avez-vous fait d'autre pendant votre stage chez Huawei ?

(4) Qu'avez-vous appris de votre stage chez Huawei ? Quelles améliorations avez-vous apportées à vos propres capacités ?

(5) Pourquoi apprendre le front-end et comprendre le front-end.

(6) Comment se déroule le passage de l'école au stage en entreprise ?

(7) Quelles nouvelles choses apprenez-vous maintenant ? (Non, je regarde les connaissances de base) Ensuite, permettez-moi de donner des exemples de connaissances et de scénarios d'application.

(8) Pourquoi existe-t-il trois principaux frameworks front-end ? Quel problème résolvent-ils ?

(9) Quelles pressions avez-vous rencontrées et comment les avez-vous relâchées ?

(10) Quelles difficultés ont été rencontrées et comment ont-elles été résolues ? ? (Demander conseil à des collègues) Comment communiquer et demander conseil ?

(11) Quelles lacunes pensez-vous avoir ? Je parle du manque d'expérience pratique (ça ne semble pas être une bonne chose)

(12) Quel nouveau contenu avez-vous appris en établissant les bases ? Syntaxe ES6, sécurité web. . . Ensuite, j'ai parlé de la sécurité Web en détail. Question à nouveau : les attaques XSS sont difficiles à détecter. Comment détecter ce problème ? .

(13) Projets de carrière futurs

(14) À quelles langues de base avez-vous été exposé ?

(15) Avez-vous déjà rencontré d’autres entreprises ?

(16) Acceptez-vous d’autres offres maintenant ?

(17) Comment apprenez-vous habituellement les connaissances front-end ?

(18) Avez-vous du temps pour un stage ? Pas le temps, je dois écrire un essai final

Enfin mes questions :

(1) Selon vous, quelles sont les perspectives de développement futur du front-end ?

(2) Interrogé sur le département, l'entreprise et la pile technologique.

9-17 Auteur : Un revers en 1,3 milliard

Lien : https://www.nowcoder.com/discuss/231656

9. Cambrian : ingénieur en apprentissage profond

16/07/2019 : L'entretien téléphonique a interrompu le buff tout au long du processus

1.Présentez-vous

2. La différence entre Python et C++ (répond à de nombreuses fonctionnalités de Python)

3. Pourquoi Python est-il lent ?

Réponse : Comme je ne connais pas le type de données, je dois porter un jugement lors de l'obtention des données.

(1. Python est un langage interprété dynamiquement ; les valeurs en Python ne sont pas stockées dans le cache mais sont dispersées dans les objets.

2. Python est un langage interpréteur. Différent du C++ et de Java, C++ et Java sont tous deux des langages compilés, c'est-à-dire qu'après avoir écrit un programme Java, vous devez d'abord compiler le programme source et générer un fichier exécutable et un fichier de classe. Après avoir écrit le programme en Python , soumis à l'interpréteur, l'interprète traduira immédiatement la première ligne de code en code machine, puis remettra cette ligne de code au CPU pour exécution, puis passera à la ligne suivante, traduira la deuxième ligne. de code, puis le transmettez au CPU pour exécution. Par conséquent, Python s'exécute plus lentement que ces langages compilés)

3. Quels livres avez-vous lu (réponse : programmation python haute performance)

4. Qu'est-ce qu'une fuite de mémoire ? Quand une fuite de mémoire se produit-elle ?

Non supprimé.

(L'espace mémoire appliqué dynamiquement n'est pas libéré normalement, mais ne peut pas continuer à être utilisé. La mémoire n'est pas libérée)

5. Quel est le terme pour fermer un programme ?

je n'en ai aucune idée !

(Il s'agit peut-être de clôturer le processus, je ne suis pas sûr)

6. Conseils et références ? Quand utiliser des pointeurs et quand utiliser des références ?

(Le pointeur n'a pas besoin d'être initialisé, mais la référence doit être initialisée et ne peut pas être modifiée après la liaison ; la différence entre passer un pointeur vers une fonction et passer une référence au pointeur :

Lors du passage d'un pointeur, le pointeur sera copié en premier. Le pointeur copié est utilisé à l'intérieur de la fonction. Ce pointeur pointe vers la même adresse que le pointeur d'origine. Si le pointeur copié pointe vers un autre nouvel objet à l'intérieur de la fonction, il ne le sera pas. Affectera le pointeur d'origine ;

Pour passer des références de pointeur, si le pointeur passé pointe vers un nouvel objet, alors le pointeur d'origine pointera également vers le nouvel objet, ce qui provoquera une fuite de mémoire, car l'endroit pointé par le pointeur d'origine ne peut plus être référencé, même si il n'y a pas de pointeur passé vers le nouvel objet, mais relâchez le pointeur lorsque la fonction se termine. Le pointeur d'origine ne peut plus être utilisé en dehors de la fonction car la mémoire d'origine a été libérée)

7. Connaissez-vous ces structures de données ?

Réponse : pile de listes de tableaux de tas

8. Qu'est-ce qu'un tas ?

Réponse : Habituellement, nous utilisons uniquement des tableaux pour simuler des tas. Nous ne connaissons pas la structure réelle. Nous pensons qu'il s'agit d'une structure de données dans l'état nœud parent-nœud enfant (problème ultra-haute fréquence, qui est généralement alloué et libéré). par le programmeur. Si le programmeur ne le publie pas, il peut être récupéré par le système d'exploitation (système d'exploitation) à la fin du programme. La méthode d'allocation est similaire à la croissance ascendante de la liste chaînée. La pile est divisée et ouverte pendant l'exécution du programme. et le noyau trouve un espace suffisamment grand dans la liste chaînée pour le donner au programme. S'il n'est pas trouvé, détruisez la mémoire inutile et recherchez à nouveau. Pour plus de détails, veuillez le résumer vous-même et le consulter fréquemment. Les différences incluent les méthodes d'application. , réponses du système, etc.)

9. La différence entre tas et pile

La pile est un espace de stockage des choses. Elle est stockée dans la partie la plus interne et sort de la partie la plus externe (problème ultra haute fréquence, allouée lors de l'exécution de la fonction et libérée à la fin de la fonction. Elle est automatiquement allouée et libérée par le compilateur pour stocker les variables locales allouées à l'exécution de la fonction. Les paramètres de fonction, les données de retour, l'adresse de retour, etc. sont ouverts vers le bas, et la vitesse est très rapide, si les performances locales sont bonnes, il interagira avec le registre et enregistrera le. Pointeur PC s'il existe de nombreux paramètres de fonction, il formera également un cadre de pile et sera stocké dans la pile)

10. Processus et fils de discussion

(Problème ultra haute fréquence, j'ai lu le résumé après une compréhension approfondie du système informatique : 1. Un processus est un programme vivant. Un programme n'est qu'un texte. Un programme en cours d'exécution est un processus, qui est l'unité de base de planification et allocation des ressources dans le système. Maîtrisez-le. Ressources, y compris la mémoire, etc. Les threads sont des processus légers et constituent l'unité de base de la planification et de la répartition du processeur. 2. Parce que le processus occupe des ressources, le poussée et le saut de pile sont lents. Par conséquent, la commutation n'est pas flexible et les threads n'occupent pas de ressources, mais seulement des ressources nécessaires (la récursion nécessite de pousser sur la pile, donc il y a des ressources), donc les threads sont faciles à communiquer -> communiquer directement dans la mémoire allouée par le processus , facile à simultanéité -> commutation flexible, la même chose La vitesse de commutation de thread du processus est très rapide, donc la surcharge du thread est faible 3. Espace d'adressage, indépendance du processus, les threads du même processus partagent des ressources et sont indépendants des threads de autres processus)

Résumé après l'événement : Évidemment j'ai échoué, j'étais très content. Cela m'a fait comprendre un problème. Ceux qui travaillent sur les algorithmes devraient aussi connaître certaines choses du back-end. Les ingénieurs dans le domaine des algorithmes doivent devenir compétents.

10. Page d'accueil 2019.7.24

aide aux devoirs

90 minutes par côté

Posez d'abord deux questions :

1. Trouvez trois nombres dans le tableau et la différence entre la somme des trois nombres et la valeur est la plus petite.

Nécessite du temps O(n2) de l'espace O(1)

Ma méthode d'écriture est le tri + les doubles pointeurs. C'est la question initiale sur leecode, je n'ai pas beaucoup brossé leecode, mais heureusement la solution est la même.

Demander un tri par tri rapide

2. Les chaînes A, B et B occupent la sous-séquence la plus courte de A (la sous-séquence la plus courte de A inclut B)

L'intervieweur et moi avons tous les deux ri, car l'opérateur Python slice + in se terminait par quatre lignes, et l'intervieweur a également ri, nous avons donc convenu d'écrire nous-mêmes la fonction pour l'étape in.

La violence résout tous les problèmes

1. Introduction au concours Kaggle (de l'EDA à la fin)

2. L'arbre de base tel que ID3C4.5 est-il un arbre binaire ou un arbre multiple ? Les entités qui ont été coupées seront-elles à nouveau coupées ?

Les fonctionnalités discrètes (nombre de discrets> 2) sont des classifications multi-branches, et le continu est une division binaire. Le continu peut être coupé, mais le discret ne peut pas être implémenté, commencez par créer une collection, parcourez les fonctionnalités et enregistrez. La position de gain d'informations maximale, puis segmentez la fonctionnalité. Après la segmentation, supprimez cette fonctionnalité de l'ensemble, afin que la fonctionnalité discrète ne soit plus coupée après l'avoir coupée. Heureusement, j'ai réagi. La fonctionnalité continue peut être à nouveau coupée pour plus de détails. , allez à Jetez un oeil au code source des arbres ID3 d'autres personnes et d'autres arbres)

3. Introduction au BN

(De nombreuses questions à ultra-haute fréquence peuvent être introduites. L'essence de l'apprentissage automatique est d'apprendre la distribution, en particulier la perte de log, ce qui équivaut à optimiser l'entropie croisée, et l'entropie croisée est utilisée pour mesurer la cohérence de la distribution. 1. Pré-blanchiment, entraînement rapide, petits gradients de saturation aux deux extrémités du sigmoïde, le BN peut être adapté à la région linéaire 2. Apprentissage de la distribution, la distribution de chaque couche se déplacera lorsque le NN sera plus profond et la distribution compressée du BN rend la distribution de chaque couche proche de la même 3 , BN peut être considéré comme un certain degré d'expansion des données et les données sont instables. Notez que pendant le processus de formation BN, n'oubliez pas que le lot actuel est normalisé et que toutes les données sont. utilisé pour la prédiction, et la couche BN a deux hyperparamètres à optimiser) 4. Quel arbre est le plus profond, GBDT ou RF ?

RF profond. J'ai parlé des idées de boosting et d'ensachage. Boost utilise un apprenant à faible variance pour ajuster l'écart, de sorte que XBG et LGB ont des paramètres pour la profondeur de l'arbre. RF est la variance appropriée. Il coupe les échantillons et les caractéristiques pour construire un ensemble d'échantillons diversifié, et chaque arbre n'est même pas élagué.

5. Comment l’importance des fonctionnalités XGB est-elle jugée ?

Réponse : Je ne suis pas sûr, mais c'est beaucoup utilisé. Je suppose que c'est basé sur le nombre de points de partage (le nombre d'occurrences dans tous les arbres).

(gain Gain signifie la contribution relative de la fonctionnalité correspondante au modèle calculée en prenant la contribution de chaque fonctionnalité pour chaque arbre du modèle. Une valeur plus élevée de cette mesure par rapport aux autres fonctionnalités signifie qu'elle est importante pour générer La prévision est plus importante .

cover La métrique de couverture fait référence au nombre relatif d'observations pertinentes pour cette fonctionnalité. Par exemple, si vous avez 100 observations, 4 entités et 3 arbres, et disons que la fonctionnalité 1 est utilisée pour décider des nœuds feuilles pour 10, 5 et 2 observations dans l'arbre 1, l'arbre 2 et l'arbre 3 respectivement, alors cette métrique calculera ; la couverture de cette fonction comme 10 5 2 = 17 observations. Ceci sera calculé pour les 4 fonctionnalités et représentera la métrique de couverture pour toutes les fonctionnalités en pourcentage de 17.

freq fréquence (fréquence) est un pourcentage représentant le nombre relatif de fois qu'une fonctionnalité particulière apparaît dans l'arborescence du modèle. Dans l'exemple ci-dessus, si la fonctionnalité 1 apparaît en 2 divisions, 1 division et 3 divisions dans chaque arbre 1, arbre 2 et arbre 3, alors le poids de la fonctionnalité 1 sera de 2 1 3 = 6 ; La fréquence de la fonctionnalité 1 est calculée en tant que pourcentage de pondération par rapport aux pondérations de toutes les fonctionnalités. )

6. XGB est facile à comprendre sa régression et sa classification binaire. Comment comprendre la multi-classification ?

Tout en discutant et en riant, j'ai répondu à l'encodage de l'étiquette au début, en utilisant onehot+softmax, mais comment ajuster chaque arbre une étape avant softmax. Je ne le savais vraiment pas. L’intervieweur m’a demandé de parler de trois catégories, s’il fallait construire 100 arbres ou 300 arbres, je m’en suis rendu compte et j’ai répondu que je pensais que c’était 100 arbres.

L'intervieweur a dit de construire 300 arbres, de les adapter à trois catégories, puis de softmax.

(Après onehot, l'étiquette d'entrée est un vecteur et un groupe d'arbres est intégré pour chaque point de prédiction dans le vecteur)

55 minutes pour les deux côtés

1. Permettez-moi d’abord de vous demander si vous vous spécialisez en PNL.

Non, dans le sens des algorithmes, nous parlons de projets de laboratoire et utilisons l'algorithme NN de nombreuses images.

2. Trois questions

Question 1 : Le Kème plus grand nombre

Trois méthodes ont été discutées

Méthode 1 : la complexité de l'analyse du tri par tas est O(Nlogk) (l'analyse est correcte)

Méthode 2 : la complexité de l'analyse binaire de tri rapide est O(N)

Méthode 3 : Tri de la complexité de l'analyse des tables de recherche (NLogN)

L'exigence est O(N), j'ai donc utilisé le tri rapide pour deux points. L'intervieweur a dit que le tri rapide peut résoudre ce problème ? Mais le tri rapide est le plus rapide (à ma connaissance) et correspond exactement à la complexité O(N) requise.

(Après la recherche sur Baidu, le tri rapide et le hachage sont les plus rapides, tandis que les autres ne sont pas rapides)

J'ai écrit le code Python à la main, mais je ne savais pas ce qui s'est mal passé en compilation. J'ai donc dit que les questions suivantes devraient être écrites en C ++ (ce problème est très grave. Je n'ai trouvé aucun bug pendant l'entretien, donc je dois faire attention à Python et m'assurer que c'est sans bug, sinon je vais Utilisez toujours C ++)

Deuxième question :

Plancher n 3, planches 1 3, plusieurs arrangements

dp [n] = dp [n-1] + dp [n-3]

Question 3 :

Probabilité égale 1-7

Créez une probabilité égale 1-10, analysez le nombre attendu d'appels 1-7

7 base, appelez deux fois pour générer 0-48, puis tronquer 40 et plus 40 puis // 4 1

L'attente n'est pas facile à calculer.

En y réfléchissant, peut-être que l'intervieweur était sous pression, alors j'ai remis en question le tri rapide. .

11. Baidu

Très efficace, j'ai eu une interview un jour après avoir soumis mon CV.

La première interview s'est très bien déroulée et la deuxième interview a duré cent minutes.

Un côté: il était si fluide que je n'ai rien enregistré dans mon cahier. La première question LIS: Je n'ai même pas agi. n ^ 2) mode d'écriture. J'ai oublié la deuxième question, alors j'ai terminé les deux côtés en une minute: ce sont toutes des questions ouvertes, il n'y a pas de réponse standard, la durée est de 100 minutes et le contenu concerne principalement les scénarios et les compétitions de recommandation? , J'ai parlé de mon travail à chaque étape et de mon travail à chaque étape. (C'est vrai, ce que l'intervieweur veut entendre, c'est probablement mon travail à différentes étapes, les problèmes que j'ai rencontrés, ma réflexion et mes solutions aux problèmes) Comment pensez-vous que vous mesurez la satisfaction des utilisateurs avec les résultats de la recherche? Sud. Je suis trop au sud. Mais j'ai parlé de la synchronisation de la connexion TCP, du filtrage du bruit de synchronisation selon la scène, tels que des scènes vidéo utilisant le moment centile de la longueur vidéo, l'efficacité des secondes en arrière, etc. L'intervieweur peut en être satisfait. Ensuite, j'ai caché mon cerveau et je ne pouvais pas penser à une autre bonne fonctionnalité, donc je viens d'utiliser des fonctionnalités faibles, comme la corrélation de Quary, etc. L'intervieweur n'est pas satisfait car ces choses indiquent principalement l'intérêt de l'utilisateur plutôt que la satisfaction. Comment pensez-vous que nous pouvons résoudre le problème de la poussée de nouveaux résultats de recherche? Réponse: Les nouveaux résultats de recherche doivent avoir un historique push de 0 et il n'y a pas de référence, mais nous ne savons pas quelle est leur qualité. Il l'a donc poussé au hasard à un petit nombre d'utilisateurs pour la promotion. Lors de la promotion, faites attention au phénomène de l'augmentation des taux de clics, filtrez-le, bla bla bla. L'intervieweur était très satisfait. Que pensez-vous des scènes et des modèles? Personnellement, je prête une grande attention à la scène, à partir de ma propre expérience de recherche scientifique, à parler de l'introduction du livre de pastèque et à raconter mon voyage mental complet. L'intervieweur peut être satisfait. J'ai oublié certaines des questions, il y en avait tellement que j'ai perdu ma voix après avoir parlé d'eux, mais les conseils de l'interviewer étaient vraiment informatifs. Et doutait de la vie. Lorsque l'intervieweur m'a critiqué comme ça, je voulais aller à Baidu parce qu'il m'a conquis.

12. Tencent

Il n'y a pas de recommandation interne, et le curriculum vitae écrit directement sur le site officiel semble être interviewé en 1 ou 2 jours, mais. . C'était à l'origine mon entreprise préférée, mais maintenant ce n'est plus. Recrutement de l'école Tencent

Département prévu TEG Appelez directement: Post de recherche

Présentez-vous et parlez du projet

Êtes-vous intéressé par notre section: champ de sécurité de détection de journaux du département

se comprendre

Nous avons une réunion, continuons à discuter la prochaine fois

10 heures: Continuez à parler de ce dont nous avons parlé la dernière fois

L'ensemble du processus était relativement détendu et agréable

La deuxième réunion est terminée, mais le statut est toujours que la deuxième réunion doit être organisée. . .

Discutez avec l'intervieweur comment utiliser les méthodes d'apprentissage automatique pour gérer la détection dangereuse de journaux. La révision des connaissances majeures apprises dès le début est également considérée comme l'auto-réflexion. L'expérience la plus importante qui peut être acquise ici est que de nombreux départements se concentrent toujours sur l'apprentissage des règles et ont des exigences d'interprétation solides pour les situations de classification d'apprentissage automatique. Par conséquent, les modèles avec une bonne interprétabilité tels que les modèles d'arbres et le LR sont très populaires. Mais à la fin, l'intervieweur m'a "remercié", ce qui implique probablement que j'ai échoué, a chanté Xin

On m'a dit que j'avais obtenu un A sur 3 ans et demi des cinq questions de l'examen écrit, et mon score était correct, mais le département a verrouillé mon CV. . .

J'ai informé les deux côtés, et après quelques minutes, ils ont discuté avec désinvolture et ont dit qu'ils continueraient à se réunir en septembre.

Le processus actuel est terminé et je me sens à l'aise. Combien de personnes dont j'ai besoin pour recruter EMM ~

13. Pinduoduo2019.8.13

Pinduoduoduo Lettre de remerciement

Un côté:

présentez-vous

Introduction aux projets de recherche scientifique

Introduction du concours de kaggle

Introduction du concours Tencent

Avez-vous déjà utilisé RNN?

Avez-vous utilisé LR?

La différence entre XGB et LGB:

Je ne pense qu'à trois points, le tri des fonctionnalités, la segmentation des fonctionnalités, les histogrammes et le tri complet.

Il a dit qu'ils ont plus en commun et ont fait une petite mention. XGB n'est pas inférieur au LGB, mais le ginseng de réglage n'est pas facile à manipuler, et le LGB est très rapide

(

1) vitesse d'entraînement plus rapide et efficacité plus élevée: LightGBM utilise un algorithme basé sur l'histogramme.

2) Accélération de la différence de l'histogramme: L'histogramme d'un nœud enfant peut être obtenu en soustrayant l'histogramme du nœud de frère de l'histogramme du nœud parent, accélérant ainsi le calcul.

3) Utilisation de la mémoire plus faible: L'utilisation de bacs discrets pour enregistrer et remplacer les valeurs continues entraîne une utilisation moins de mémoire.

4) Précision plus élevée (par rapport à tout autre algorithme d'amélioration): il utilise la méthode de division des feuilles (sélectionnant le nœud avec le plus grand profit de division parmi tous les nœuds de feuilles actuels pour la division, etc. Cette méthode est facile à surfiance, car il est facile de tomber dans une profondeur relativement élevée, il est donc nécessaire de mesurer la profondeur maximale. (pour éviter le sur-ajustement), qui produit une division aveugle sur tous les nœuds de chaque couche. qui est le principal facteur pour atteindre une précision plus élevée. Cependant, cela peut parfois conduire à un sur-ajustement, mais nous pouvons empêcher le sur-ajustement en définissant le paramètre | max-depth |

5) Capacités de traitement des mégadonnées: par rapport à XGBOost, en raison de sa réduction du temps de formation, il peut également avoir la capacité de traiter les mégadonnées.

6) Soutenez l'apprentissage parallèle.

7) Échantillonnage local: conserver des échantillons avec de grands gradients (grandes erreurs) et des échantillons d'échantillons avec de petits gradients, réduisant ainsi le nombre d'échantillons et augmentant la vitesse de calcul.

)

Pour les questions liées au code, demandez à l'intervieweur de choisir C ++ ou Python.

Mon choix est Python.

Il y a des pièces d'échecs sur le tableau d'échecs.

dp [i] [j] = max (dp [i-1] [j], dp [i] [j-1])

Si les échecs [i] [j] == 'pièce d'échecs':

dp [i] [j] = 1

Ermien: Je suppose que c'est cool, pas une bonne réponse.

Un autre intervieweur avec un buff d'interruption intégré est en train de jouer avec mon train de pensée.

1. GBDT et XGB

(GBDT, XGB et LGB doivent être maîtrisés dans tous les projets mentionnés)

2. BN, abandon

(Le décrochage peut être utilisé comme une astuce alternative pour entraîner des réseaux de neurones profonds. Dans chaque lot de formation, en ignorant la moitié des détecteurs de fonctionnalités (laissez la moitié des nœuds de couche cachés ont des valeurs 0, bien sûr cette "moitié" est Un hyperparamètre, le réglant vous-même) peut réduire considérablement le phénomène de sur-ajustement.

Le décrochage signifie simplement: pendant la propagation directe, nous laissons la valeur d'activation d'un certain neurone cesse de travailler avec une certaine probabilité p.

En fait, il s'agit d'une stratégie d'ensachage pour construire une combinaison de sous-réseau. )

3. Pourquoi n'utilisez-vous pas d'abord LR (pourquoi utiliser LR si facilement?) Utiliser LR pour deux classifications et l'empilement est assez bon, mais LR sent toujours que son expressivité ne suffit pas, et l'effet peut être moyen si les fonctionnalités sont plus épais. 4. Comment distinguer les fonctionnalités de la compétition Tencent? Le seau est plus uniforme. Les caractéristiques continues sont croisées. 5. Connaissez-vous l'AUC?

Je ne sais pas comment le calculer.

(Il n'y a pas de tel AUC pour la régression)

6. Lequel est plus rapide pour développer, tas ou pile?

MMP était complètement contraire à ce qu'il a dit, et il lui a fallu beaucoup de temps pour réaliser ce qu'il disait. Ce dont je parle, c'est que le tas est alloué pendant la compilation, il n'est donc pas nécessaire de se développer ou de rétrécir quoi que ce soit. mauvaise réponse)

7. surcharge et réécriture

(Notez que la réécriture est une réécriture d'une fonction virtuelle. Je lui ai mal répondu à l'époque. La surcharge dite signifie que la liste des paramètres de la fonction avec le même nom est différente. La fonction sera renommée lors de la compilation. En fait, , ils n'ont plus le même nom lors de l'exécution; )

8. Comment utiliser les mégadonnées pour trouver les 100 articles de magasinage les plus populaires

Construisez un petit tas de table de hachage

9. Comment faire la couche inférieure de la carte

J'ai dit que je n'avais pas encore regardé le code sous-jacent. (Au fait, je ne savais pas qu'il y avait une chose telle que la carte. Je viens de faire des tables de hachage à la main. Je prévois de jeter un œil à l'analyse du code source STL lorsque j'ai le temps)

(L'arbre rouge-noir sous-jacent, une structure de données O (log (n), insertion et suppression)

Quant à la complexité de l'indice, j'ai dit, log (n).

10. Y a-t-il un (1) un? Il m'est soudain apparu qu'il y avait une table de hachage après l'avoir essuyé.

Que faire s'il y a un conflit de table de hachage

Réponse par Zip Heavy Hash actuellement 1

(Même problème à haute fréquence, fermeture éclair: liste liée, le conflit est à la fin de la liste liée; détection: détection linéaire, détection secondaire, telle que la valeur actuelle 1; re-hashing: fonctions de hachage multiples)

En fait, je ne suis pas très bon en STL. Je n'aime pas utiliser les fonctions de bibliothèque STL, ce qui ne me rend pas très bon dans STL. Attendez un certain temps pour lire une vague d'analyse de code source STL.

14. Mogu Street 2019.8.14

mogujie

L'expérience de l'interview a été très bonne, les première et deuxième interviews se sont bien déroulées, et la RH a été très bonne. Lorsque j'ai reçu l'avis d'entrevue pour la première fois, lorsque j'ai ouvert le lien, c'était l'interface a une heure d'entrevue, une boîte modifiable, un bouton OK et un bouton Abandonnez. L'invite se lit comme suit: Si vous cliquez sur OK, le temps ne peut pas être modifié. Je n'ai pas osé cliquer sur le bouton de quitter, alors j'ai appelé les RH et j'ai demandé, et ils ont dit que je pouvais simplement abandonner à l'époque que je voulais. Au cours de la deuxième interview, l'invite de cette boîte a changé, si vous cliquez sur OK, le temps ne peut pas être modifié. J'ai senti que les RH étaient vraiment bonnes, alors j'ai exprimé frénétiquement ma satisfaction, mon soutien et mon appréciation pour le travail des RH lors de la deuxième interview. Je pense donc que si l'interview RH est passée, la seule chose qui reste est l'interview croisée.

Mais je dis la vérité, j'aime vraiment leur RH.

Présentez-vous, deux questions

Le premier cours:

Le plus grand nombre de privilèges dans les 1000

Il a été dit que Python peut mettre en œuvre un générateur de nombres premiers et une méthode de dépistage dans l'espace O (1), mais il n'a pas été écrit, et il ne sera pas écrit s'il n'y a aucune exigence. à l'ordre de grand à petit.

Complexité d'analyse, comment réduire la complexité? Recherchez de haut en bas, à partir de 999 et en descendant, en s'arrêtant lorsqu'il est trouvé, -2 à chaque fois. Bool Jugement, à partir de 2 au numéro de racine X, tous les modulo, non 0, sauteront en faux. Mais il semble que l'intervieweur ne connaisse pas Python? Je suis donc passé à C ++ pour la question suivante.

Le deuxième cours:

La mise en œuvre de la division sans division est très simple

Notez que dans mon écriture, ABS (un nombre négatif) en C ++ peut déborder, mais peu importe que la vitesse A soit plus importante lors des entretiens.

Pendant le test écrit, je me préparais à l'optimisation binaire et le sujet suivant est apparu.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48

 #include <iostream>
using namespace std;
int jianfa(int num1,int num2)
{
    int re = 0;
    bool fuhao = false;
    if ((num1<0 && num2<0) || (num1>0 && num2>0))
    {
        fuhao = true;
    }
    num1 = abs(num1);//小心溢出
    num2 = abs(num2);//小心溢出
    if(num2==0)
    {
        cout<<"div zero error"<<endl;
        return 0x3f3f3f3f;
    }
    if(num1<num2)
        return 0;
    int tmp=1;
    while(num1>num2)
    {
        tmp*=2;
        num2*=2;
    }
    num2/=2;
    tmp/=2;
    while(num2)
    {
        if(num1>=num2)
        {
            num1-=num2;
            re =tmp;
        }
        num2/=2;
        tmp/=2;
    }
    if(fuhao)
        return re;
    else
        return -re;
}
int main() {
    int num1,num2;
    cin>>num1>>num2;
    cout<<jianfa(num1,num2);
    return 0;
}

Posé beaucoup, beaucoup de questions:

Je ne me souviens pas de certains d'entre eux et j'ai perdu ma mémoire. .

1. Pourquoi n’avez-vous pas une expérience de stage?

Le premier point est que l'enseignant ne me permet pas de trouver un emploi. (C'est la vérité. Aujourd'hui, l'enseignant a dit à un autre camarade de classe, avez-vous trouvé un emploi? Si vous avez trouvé un emploi mais que vous ne pouvez pas obtenir votre diplôme, pensez-vous que votre travail était vain ...)

Le deuxième point est que pour être exposé à l'ingénierie réelle, j'ai participé à des compétitions en plus de la recherche scientifique, Blah bla bla. L'intervieweur peut être satisfait.

2. Avez-vous déjà utilisé LR?

nécessaire

3. LGB est-il meilleur que XGB?

Introduire directement les différences entre les deux

4. L1 et L2 sont-ils différents? Pourquoi L1 peut-il être clairsemé?

Du point de vue de la distribution mathématique, l'un est la distribution de Laplace et l'autre est la distribution gaussienne; L'ingénierie parle de la dérivation approximative de L1 et de l'optimisation dans l'intervalle 0 et à l'extérieur de l'intervalle. Ensuite, L2 est relativement simple à dériver directement.

5. Quels apprenants sont convexes et supérieurs?

LR Sigmoïd Logloss est convexe. Régression linéaire, les moindres carrés optimisation convexe. SVM est convexe et supérieur. NN n'est certainement pas convexe car il converge souvent vers le point de selle. PCA a d'innombrables solutions mathématiques, mais l'utilisation de valeurs propres peut obtenir la solution optimale.

(Notez que la perte carrée sigmoïde n'est pas une optimisation convexe)

6. Comment mesurez-vous l'importance des fonctionnalités, telles que la combinaison et la suppression des fonctionnalités, et comment ajustez-vous les paramètres?

Réponse: Utilisez une embouteillage croisé pour la combinaison de fonctionnalités. La combinaison dépend de la distribution réelle. .

La suppression des fonctionnalités et d'autres aspects m'ont rappelé les étapes de dépistage des fonctionnalités d'un certain boss de Kaggle.

Ajuster les paramètres:

La première étape est les paramètres ancestraux. Par exemple, la profondeur du modèle d'arbre, la fréquence d'échantillonnage, etc. Ceci est principalement basé sur l'expérience.

La deuxième étape consiste à ajuster les paramètres, tels que l'essai de nouvelles fonctionnalités.

7. Combien de fonctions d'activation connaissez-vous?

J'ai dit que je ne mentionnerais pas le sigmoïde le plus simple Tanh Relu.

8. Qu'est-ce qu'un point de selle?

Pourquoi ai-je dit cela si stupidement, puis j'ai dit que je l'avais oublié, mais ce n'était certainement pas le point optimal local.

(Il est mieux compris avec l'image du point de la selle. Notez qu'une direction est vers le haut, il est donc facile de glisser d'en haut jusqu'au point de la selle sur la diapositive. L'autre direction est vers le bas, vous pouvez donc descendre sur le descendant Slice, mais le gradient ici à la selle est de 0, ce qui est plat. point) Dans une équation différentielle, un point singulier qui est stable dans une direction et instable dans une autre direction est appelé point de selle.

Le point critique est appelé point de selle. Dans une matrice, un nombre qui a la valeur maximale dans sa ligne et la valeur minimale dans sa colonne est appelée point de selle. En physique, il est plus large et fait référence au point où la valeur maximale est dans une direction et la valeur minimale est dans l'autre sens.

D'une manière générale, les courbes, les surfaces ou les hypersurfaces dans le voisinage d'un point de selle d'une fonction lisse (courbe, surface ou hypersurface) sont toutes situées sur différents côtés de la tangente à ce point. )

Permettez-moi d'abord de demander si vous avez déjà utilisé RNN.

Réponse: L'effet RNN du projet, analysez si le RNN n'est pas bon dans le projet et l'effet de stade précoce de RNN dans la compétition (l'effet de stade précoce est le meilleur)

Avez-vous déjà utilisé GRU?

Réponse: GRU a été utilisé une fois. La porte de mémoire utilisée assure une transmission de mémoire à long terme.

9. Quelle est l'attention?

Réponse: J'ai déjà mentionné que j'avais utilisé l'attention, mais je ne l'ai déjà utilisé et je ne connais pas le principe.

(En tant que grenan, j'ai essayé divers réseaux, mais je ne comprends toujours pas très bien la nature de l'attention. L'attention est tout ce dont vous avez besoin?)

10. Pourquoi l'abandon empêche-t-il le sur-ajustement?

Du point de vue de l'agitation, NN est un apprenant avec une petite déviation et une grande variance.

11. Filtrage collaboratif:

Il a dit qu'il l'avait compris mais n'avait jamais écrit de code.

(Filtrage collaboratif, je pense que si un étudiant est principalement engagé dans la recherche scientifique, il est toujours difficile de contacter. Si vous êtes intéressé, vous pouvez le découvrir, surtout en ce qui concerne Toujours facile à demander)

12. Qu'est-ce qui est utilisé pour estimer CTR?

Lorsque je parle de LR et FM, j'ai écrit des codes.

13. À quoi sert Mogu Street?

Réponse: vendre des vêtements. Il a donc présenté que Mogujie était principalement le commerce électronique et le streaming en direct. (J'ai presque ri quand j'ai entendu la diffusion en direct. Je ne pouvais plus le retenir, donc je me sentais inexplicablement heureux. Ensuite, quand il a vu que je ne pouvais plus le retenir, il a rapidement dit que la diffusion en direct était actuellement le module à la croissance la plus rapide de la rue Mogu)

Deux côtés:

Cela s'est bien passé, je n'ai pas codé, car je n'ai pas eu assez de temps pour me rencontrer pendant une demi-heure.

Il y a une implémentation complète du logiciel dans mon projet, et la partie principale dont je suis responsable dépasse 10 000 lignes de code.

En fait, je peux faire la majeure partie du codage manuel normal (sauf pour les chaînes, ce qui est ma faiblesse).

A présenté le projet et parlé des détails du projet

Dans le projet, les combinaisons de fonctionnalités dans le champ de codage sont toutes XOR, donc en utilisant Relu BN pour extraire les fonctionnalités, BN est vraiment une énorme amélioration.

Parlez des principes, des formules et de la mise en œuvre de BN

(Vous pouvez consulter le code source BN, ce n'est pas long)

Pourquoi utiliser BN pour compresser la partie positive de la carte après XOR au lieu de quelque chose (pas entendu clairement)?

J'ai mentionné que la couche BN compte également comme l'expansion des données, et la couche BN dit le flux de codage avec seulement 0 et 1, afin que le gradient puisse être modifié et que l'optimisation est meilleure (l'apprentissage automatique est possible uniquement pour deux points, le second point c'est un problème d'optimisation)

Pourquoi utiliser CNN? Ensuite, l'intervieweur a introduit une autre chose (intégration) dans le champ de recommandation.

Réponse: (En fait, je connais l'intégration parce qu'un ami qui a participé à la compétition a joué NFM. La première couche est la couche d'intégration.) Ma réponse est biaisée vers les scènes, une caractéristique dans le domaine du codage: seule la corrélation locale, le temps- invariant. Par conséquent, il n'est pas bon d'utiliser CNN pour effectuer une intégration mondiale. Les caractéristiques de la recommandation sont rares après la discrétisation, et les fonctionnalités elles-mêmes peuvent avoir des informations interactives d'ordre élevé, donc la cartographie en vecteurs latents sera meilleur. Ceci est déterminé par la scène. (J'ai également introduit pourquoi Resnet est meilleur pour les images, mais en codage, les performances de mon réseau de réglage des paramètres extrêmes à deux couches ont dépassé celle du réseau résiduel. En fait, tout est déterminé par la scène)

Trois côtés: Big Boss Cross Side

L'intervieweur est un gros coup!

Présentez-vous, allez-vous venir à Mogu Street? Le dialogue précédent a été très fluide, principalement parce que j'introduisais mon propre jeu, du début à la fin, de l'arrière-plan du jeu, du voyage mental au milieu et du traitement final. Les premiers et deuxième examens se sont bien passés, et les deux premiers examens se sont également bien passés. Sinon, ma rue Mogujie serait stable.

Compte tenu d'un flux de supports, trouvez les paires consécutives correspondantes légales 1 dans la chaîne s = '(()) (() () ()' La sortie est 3. Mon DP ci-dessous semble avoir un supplément de 0 au début? J'ai donc dit que je n'étais pas bon dans les cordes. La programmation dynamique peut être effectuée, ce qui est ma force. En bas. = '()' Je pensais que l'entrée était entrée, mais la lecture réelle de S devrait être vide. Nani? 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 25 27 27 28 29 30 31

 #s = input()
s = '(())(()()()'
#s = '(())(()'
re = []
dp = [0]
for i in s:
    if not re:
        re.append(i)
        dp.append(0)
    else:
        if i=='(':
            re.append(i)
            dp.append(0)
        else:
            if re[-1]=='(':
                re.pop()
                dp.append(dp.pop()+1)
            else:
                re.append(')')
                dp.append(0)
print(re)
print(dp)
m = 0
cur = 0
for i in dp:
    if i!=0:
        cur+=i
        m = max(cur,m)
    else:
        cur = 0
print(m)
输出：
['(']
[0, 0, 2, 0, 1, 1, 1]
3

En posant des questions à la fin, l'intervieweur a dit quelque chose de très bon. D'une manière générale, nous n'avons qu'à trier par ordre partiel, mais dans certains cas de publicité sur les enchères, nous devons donner des estimations précises afin que nous puissions diviser facilement l'argent. Par exemple, le taux de clics, CTR ou d'autres combinaisons, le revenu doit être calculé en fonction de ce classement. De plus, dans la recherche recommandée, le patron a également introduit certaines choses connexes. C'est-à-dire que les choses rappelées peuvent être trop répétitives ou doivent être filtrées (par exemple, elle ne convient pas aux enfants, et tout le monde est fou, ce qui n'est pas bon), alors comment le filtrage est-il fait? Et si vous recommandez à une certaine personne, une façon est d'envoyer la foule sans faire de fonctionnalités, car lorsque vous poussez à une certaine personne, cette personne est équivalente à toutes les publicités ou autres recommandations, afin que vous puissiez interagir avec cette personne pour Rappel et tri. Enfin, j'ai posé des questions sur l'âge moyen de l'entreprise, car je m'en soucie personnellement. L'intervieweur m'a dit de ne pas être accablé. 5 ans. Strong, beau et fort), il me soutenait davantage d'arrêter après avoir travaillé pendant deux ans. De plus, il a dit que Mogujie est une plate-forme de taille moyenne avec des avantages uniques. Le flux de données peut utiliser de nombreux modèles. Compagnie. Vous pouvez mieux vous exprimer lorsque vous venez à Mogujie. J'ai reçu une notification de la RH et j'ai demandé à attendre que l'intervieweur vienne à l'école ou vienne directement dans l'entreprise pour une interview.

15. Développement de jeux de divertissement interactif NetEase Interactive

un côté

1.Présentez-vous

Je n'ai pas grand-chose à offrir.

J'ai parlé du logiciel de recherche scientifique que j'ai écrit.

Quand je me suis présenté, j'ai mentionné que j'aime jouer à des jeux (j'avais l'habitude de jouer aux versions piratées, mais maintenant j'en joue des authentiques, avec un niveau de vapeur 50 ou plus, puis le jeu est presque 100)

(J'ai appris par moi-même un développement back-end, et je n'ai pas besoin de Python pour le divertissement mutuel)

2. Quels jeux aimez-vous habituellement jouer?

Je fais des recherches scientifiques récemment et je n'ai pas joué à des jeux. J'aimais jouer Zelda, Dark Souls, Monster Hunter, etc.

3. Avez-vous déjà joué aux jeux NetEase?

Onmyoji et Hearthstone

4. Parlons de Hearthstone?

J'aimais vraiment jouer à Hearthstone, principalement parce que j'aimais les packs d'ouverture (l'intervieweur a ri), et j'ai dépensé beaucoup d'argent sur Hearthstone parce que j'étais prêt à soutenir un jeu si je l'aimais. L'avantage de Hearthstone est qu'il est compétitif, et c'est aussi un jeu de cartes, donc il est intéressant en soi, et chaque jeu est aléatoire, de sorte que l'expérience de chaque phrase est différente. Un autre point consiste à économiser des pièces d'or pour ouvrir des packs. De cette façon, vous aurez de nouvelles expériences à chaque fois et conserverez les utilisateurs.

5. Trois questions, relativement simples, vous devez écrire des cas de test

La déchirure de la main réussit et l'écriture de code est relativement rapide.

Deux points pour la première question

La compilation écrite dans Python a rapporté une erreur.

Les quatre conditions limites de bissection sont discutées

Les deux types de retour ST et EN correspondent à la limite de recherche retournée, aux données [mid] <valeur et <= valeur, et les deux types correspondent aux limites supérieures et inférieures.

共四种，然后说四种情况对应，每种的取值范围返回st，返回的取值范围是0到数组长度,返回en，则是-1到数组长度-1 st和en含义不一样，这个最好自己写写理解一下（更新了一下lower_bound的理解，解释了为什么返回值范围是0到len(data) PS：标准库返回的是迭代器位置，是一个指针，我这里从元素的位置概述。 lower_bound 返回数组大于等于value的第一个位置，假如数组中所有元素均小于value，返回尾部迭代器len(data)，第一个元素大于等于value，返回0 （第一个元素大于等于value，则所有元素大于等于value，则返回0）从定义看，这样定义就不可能返回负1。找身边的跳动大佬讨论了一下，应该没写错了，有误请指正呀。 upper_bound返回大于value的第一个位置。同理，理论上返回值就不包含-1。标准库的写法里，返回的是st。加入返回的是en呢，那么返回的含义是什么呢？即返回的st情况-1 lower_bound :返回大于等于value的第一个位置lower_bound_en：返回小于value的第一个位置

upper_bound:返回大于value的第一个位置upper_bound_en：返回小于等于value的第一个位置1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 def lower_bound(data,value): st = 0 en = len(data)-1 mid = st+((en-st)>>1) while(st<=en): if data[mid]<value: st = mid 1 else: en = mid -1 mid = st+((en-st)>>1) return st def lower_bound_en(data,value): st = 0 en = len(data)-1 mid = st+((en-st)>>1) while(st<=en): if data[mid]<value: st = mid 1 else: en = mid -1 mid = st+((en-st)>>1) return en def upper_bound(data,value): st = 0 en = len(data)-1 mid = st+((en-st)>>1) while(st<=en): if data[mid]<=value: st = mid 1 else: en = mid -1 mid = st+((en-st)>>1) return st def upper_bound_en(data,value): st = 0 en = len(data)-1 mid = st+((en-st)>>1) while(st<=en): if data[mid]<=value: st = mid 1 else: en = mid -1 mid = st+((en-st)>>1) return en

对比的数改成1。

）然后说了C++算法标准库（lower_bound和upper_bound）用的哪两种形式：返回st的那两种注意C++标准库返回的是指针第二题是二叉树的深度

python手撕，又报错，然后无IDE查bug还好查到了，print大发好，对python，如果print(“XXX”)没输出东西就说明没运行这一行。

定义树class的时候写的是.next，晕了，应该是.left和.right

第三题是数组旋转

左旋转，自信一波分析写完是右旋转，一脸懵逼，怎么看都是左旋转跑完就是右旋转

然后再那试了试改i,j，然后第二次就输出对了，晕，运气比较好

由于循环用的常数限制，要求改成了数组的范围，注意python len(data)是行len(data[0])是列

正常构造一个和data一样大new数组是先列后行[[0 for _ in range(len(data[0])] for _ in range(len(data)]

然后循环是先行后列（这样局部性更好，运行速度快，更容易缓存命中，当然面试官也没问我也没提）

写法应该是对的，但我不敢改成行列不相等的情况，万一错了呢.PS:想了想应该不对，因为new数组我照着data开辟的，应该行列反过来开辟才对，先行后列构造的话正好对应旋转后的情况，幸好没深究，不过这种bug很容易改，print()大法print一下就出来了

问问题：好希望他问我机器学习的东东，这样我就能装逼了，然而

6、静态内存和动态内存?

讲了static和堆栈是静态,编译的时候决定了大小，动态内存可以自由开辟->堆，也不知道对不对。 .

（回来问了问另一个收割大佬，应该是这样）

7、堆是？

说了向上开辟，速度慢、运行时改，然后开辟的过程，链表存着下一个位置和这一块有没有使用，如果没找到就析构合并内存再找，再找不到返回null（可以参考前面的答案）

8、堆栈是？

说了向下开辟、速度快、编译时分配、主要是存PC指针，然后函数入口参数多组成栈帧存进去等着恢复

9、malloc和new区别free和delete？

1、一个是函数（面试官没问，但我自觉呀，诚实回答忘了是哪个头文件里的了，事后查了查是stdlib我擦我天天写没想到是这个）一个是关键字

2、malloc要算大小，返回void*(然后随口提到void*可以转XX *),强转后按转完后的类型用，要自己算大小；new的时候传类型，就比如100个int，然后直接开100个就好了，他自动将int长度算进去

3、malloc再堆上，new在自由存储区（然后回答忘了自由存储区再哪了）讲着讲着忘了free和delete的事了

（自由存储区和堆似乎是概念上的区别？我丢，深入理解计算机基础是按C讲的，我哪知道C++的自由存储区和C的堆有啥区别呀，按理来说假如new是依赖malloc实现的，那么他们不该开辟于同一块区域么。C++默认在堆上开辟new需要的空间，所以new来自自由存储区和堆都行。

网搜的答案：

自由存储区是C++中通过new与delete动态分配和释放对象的抽象概念，而堆（heap）是C语言和操作系统的术语，是操作系统维护的一块动态分配内存。

new所申请的内存区域在C++中称为自由存储区。藉由堆实现的自由存储，可以说new所申请的内存区域在堆上。

堆与自由存储区还是有区别的，它们并非等价。

)

10、智能指针了解不？

我从python的内存管理角度讲了计数法析构内存，和智能指针原理一致。但我自觉诚实的说出我没用过智能指针

11、python怎么解决循环引用的？

是不是想问我智能指针的循环引用解法？我忘了呀，我就直说python本身解不了循环引用的问题（这实话实说，确实解不了，python又不是神，循环引用要靠自己析构，对python来说，循环引用的东西就算程序关了都还在），但python有个库函数可以发现循环引用位置，然后调用垃圾收集器析构掉就好（其实就是定位内存泄露，然后gc把它干掉）

12、计网了解不？计算机网络TCP和UDP的区别？

答自学。回答了很多，挺详细了

（UDP主要用于那些对高速传输和实时性有较高要求的通信或广播通信，

TCP用于在传输层有必要实现可靠性传输的情况

1、TCP面向连接（如打电话要先拨号建立连接）;UDP是无连接的，即发送数据之前不需要建立连接

2、TCP提供可靠的服务。也就是说，通过TCP连接传送的数据，无差错，不丢失，不重复，且按序到达;UDP尽最大努力交付，即不保证可靠交付

3、TCP面向字节流，实际上是TCP把数据看成一连串无结构的字节流;UDP是面向报文的；UDP没有拥塞控制，因此网络出现拥塞不会使源主机的发送速率降低（对实时应用很有用，如IP电话，实时视频会议等）

4、每一条TCP连接只能是点到点的;UDP支持一对一，一对多，多对一和多对多的交互通信

5、TCP首部开销20字节;UDP的首部开销小，只有8个字节

这里建议不是特别熟的回答首部设置不一样，别说的太详细。

6、TCP的逻辑通信信道是全双工的可靠信道，UDP则是不可靠信道

)

13、长传输和短传输？

je n'ai aucune idée

（是http的长连接和短连接吗？HTTP1.1规定了默认保持长连接（HTTP），数据传输完成了保持TCP连接不断开（不发RST包、不四次握手），等待在同域名下继续用这个通道传输数据；相反的就是短连接。）

14、操作系统呢？

回答自己看的深入理解计算机系统，看的很详细，收获了特别多

15、进程和线程？

程序不过一段文本，运行起来才是进程，一顿讲，资源/调度单位啊、共享内存啊、并发啊XXXXXX

（见之前的答案）

16、你还有什么问我？

问了两个问题

一问：您能不能了解到其他面试人的信息，然后对着我教研室座位后面的字节大佬猛夸（因为他特别想去互娛做游戏），一开始面试官还以为这个人挂了呢我想捞一手，一听和我同时面了互娱就轻松了说既然这么强一定能过面试，然后我就突然想到好像可以暗示一波，就说我和他报的都是广州，我很想和他当同事（强烈暗示）

二问：我说我是算法工程师，机器学习特别厉害，平时工作内容是啥啊，机器学习这部分我都用上么

求互娱给个开奖机会，教练我想做游戏~（如果百度把我忘了的话），你敢让我过我就敢去宁可别被我逮住了

16. 360 搜索（Ranking）-机器学习工程师

负责360搜索的部门，面试体验很好。

一面：上午10点40 1小时

忘了面试的一部分，因为连续4面，其中技术面360两个，网易互联网1个，hr面1面，非常之累。

1.Présentez-vous

2、介绍自己实现的科研软件

用什么语言：C++

什么写的界面：QT

3、LGB和XGB区别

一开始听错了以为是LSTM，我还在想LSTM和XGB的区别，这怎么说，先介绍介绍XGB吧，然后说完XGB反应过来，面试官不是让我说LGB吧。 .那就好说了，一顿讲。

（答案前面有）

4、介绍CNN、卷积层如何实现非线性

使用激活层，不然在卷积都是线性变换。我从猫的视觉锥细胞开始一顿讲，应该讲的挺详细了，CNN的时不变性真的很适合用于信号处理。讲了时不变和局部权值共享，说CNN是DNN的特例。

(

卷积：对图像（不同的数据窗口数据）和滤波矩阵（一组固定的权重）做内积操作。

卷积的重要的物理意义是：一个函数（如：单位响应）在另一个函数（如：输入信号）上的加权叠加。

卷积神经网络CNN是多层感知机(MLP)的变种。20世纪60年代，Hubel等在研究猫脑皮层时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性，继而提出了CNN。

CNN：局部连接和共享权值的方式，减少了的权值的数量使得网络易于优化，另一方面降低了过拟合的风险。该优点在网络的输入是多维图像时表现的更为明显，使图像可以直接作为网络的输入，避免了传统识别算法中复杂的特征提取和数据重建过程。在二维图像处理上有众多优势。

CNN具有一些传统技术所没有的优点：良好的容错能力、并行处理能力和自学习能力，可处理环境信息复杂，背景知识不清楚，推理规则不明确情况下的问题，允许样品有较大的缺损、畸变，运行速度快，自适应性能好，具有较高的分辨率。它是通过结构重组和减少权值将特征抽取功能融合进多层感知器，省略识别前复杂的图像特征抽取过程。

CNN的泛化能力要显著优于其它方法，卷积神经网络已被应用于模式分类，物体检测和物体识别等方面。利用卷积神经网络建立模式分类器，将卷积神经网络作为通用的模式分类器，直接用于灰度图像。

)

5、卷积层pooling层怎么放？激活层放哪里比较好，有什么区别？

没听明白，不该是中间夹一个激活层吗。面试官的pooling真的是一言难以呀？我一直以为是最后的全连接FC层，我心想这不是被全局池化代替了么？不会所以一顿乱说？因为我自己也是改网络的时候，经常会尝试层的位置交换，我都是哪个效果好用哪个。讲的时候想起了何凯明大神的论文里的预激活，然后对着预激活、卷积层在Resnet的作用一顿夸。有会的大佬么。请私聊教教我。 . .

两道题

1、10进制转K进制进制转换

给定一个十进制数M，以及需要转换的进制数N。将十进制数M转化为N进制数输入描述输入为一行，M(32位整数)、N(2 ≤ N ≤ 16)，以空格隔开。输出描述为每个测试实例输出转换后的数，每个输出占一行。如果N大于9，则对应的数字规则参考16进制（比如，10用A表示，等等）这题很简单，发个自己的写法，过一遍就好，挺简单的。可能个别边界会有问题，但是面试的时候尽量追求速度。牛客网面试的时候，注意运行全部用例，可以看AC的情况，为什么这么说呢，因为你的输入面试官看不见（他说的），所以他只能给你跑一下看过了多少例子。像这种水题一定要写得快。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53

 //map<int,char>table;
//table[0]='0';
//table[10]='A';
#include<stdio.h>
#include<iostream>
#include<string>
#include<vector>
using namespace std;
void reverse(vector<int>&a)
{
    int l = a.size();
    for(int i=0;i<l/2;  i)
    {
        int tmp = a[i];
        a[i] = a[l-i-1];
        a[l-i-1] = tmp;
    }
}
string get(int M,int K)
{
    bool ju = false;
    if(M<0)
    {
        ju = true;
    }
    //注意负数转正数溢出
    M=abs(M);
    vector<int>data;
    while(M)
    {
        data.push_back(M%K);
        M/=K;
    }
    reverse(data);
    string res = "";
    if(ju)
        res ='-';
    for(int i=0;i<data.size();i  )
    {
        if(data[i]<=9)
            res ='0' data[i];
        else
            res ='A'-10 data[i];
    }
    return res;
}
int main()
{
    int M=7,K=2;
    cin>>M>>K;
    string s = get(M,K);
    cout<<s<<endl;
}

2、A->B,B->C,A->C,C->A中有一对链子A->C，C->A问序列里有多少对链子使用哪种数据结构？

要求：序列很长，只看直接相连，A->B->C->A 不算ABC互联。

讲了比较简单的d[i][j]=(bool)的结构，O(N^2)的时间和空间复杂度

又讲了两次扫描，O(N^2)的时间复杂度，O(1)空间复杂度

最后说了数组＋链表，极端情况下时间复杂度也较高，但我心里想的是对链表排序也不慢吧，二分查找，时间空间都OK呀，但我傻就傻在我心里想了，嘴上没说链表排序。

最后有会的大佬么请教教我。 .

二面：

体验好，一道题，抽的前两道题都做过，一个是奇偶排序，一个是前序中序重建树

都是剑指OFFer原题，面试官见我思路顺畅，问我是不是做过，做过默写就没意思了。

我说做过剑指OFFer原题。前两道题没手写。

第一道奇偶排序要求稳定排序，思路1就是归并排序，前偶后奇为大于。思路2双指针二分偶数倒

第二道找根节点，二分，没了

第三道没做过，但是也简单，问面试官能不能用python，能的话两分钟结束这道题，说不行就老实写了

这一面主要是深挖项目，深挖！

反问环节，面试官疯狂指导我，真好，这里总结了记住的一部分：

聊了搜索推荐的一些问题，我问的第一个是360对编程能力的要求。面试官的回答是所有的算法工程师都要具备很强的编程能力。

第二个是推荐中排行榜的问题，我说上了排行榜，阅读量就是疯狂增加，一增加就会更留在排行榜上，这种情况怎么办。面试官回答这是正反馈问题，说了很多干货，有兴趣做推荐的可以看看相关内容。

我又问了冷启动的问题，我就说对于新出现的页面，第一次出现，没有任何曝光下，如何给他做推荐呢？这里面试官反问了我，我就回答了自己的思考，先小批次试点曝光，再推广。

面试官开始讲推荐和搜索排序的区别，搜索排序面临的问题更复杂。所谓排序就是获取大数据的网页界面，然后对用户的查询给出一个最可能的结果(LGB可用)，用到一些分层、召回(最优可能查询结果捞出来)、排序(对捞出来的东西排序)，这里排序要做到去相关性，查询要保证输出结果多样性、表达多样性，还牵扯到了词与词之间的紧密度、运营和相似度命中。

In addition, there are many difficulties in sorting. First, the amount of data is larger and a lot of information is captured. However, the more indexes, the better, because there are duplicate (plagiarized web pages) and low-quality web pages .另外对于learning to rank，我们不需要像回归那样得到准确的回归值，只要得到他的偏序就好。比如A<B，我们算价值是A：80，B：79和A：80 B：77，偏序都一样，只要排序正确即可。而要检验我们排序的好不好，就是根据反馈，检验模型的优劣，比如我们把A在B前面，但是用户不点A点B，用户改Quary词或者翻页，都可以用于检验模型效果。这三时候可能会用概率图解决这些问题。排序技术难度大，底层需要的技术也比较高级。 In addition, there may be a certain gap between the user's inquiry and our results. For example, when a user searches for the price of a certain car, the search result we give is the transaction price of a certain car. This creates a gap .

最后我问了这么一个问题，就是我在做学习强国的时候，查询一个答案，结果第一个是付费的，第二是是免费的，有限的时间里查到的第一个结果让我付费观看，我就很生气。 Qu'en pensez-vous ?面试官的回答也是很棒呀，所谓的搜索排序最终就是给用户满意的结果，结果可能是多样的，有的排版好内容丰富，有的排版差内容差，我们做的就是把最好的结果展示给用户。对于搜索排序，可能产业化的结果分两个，第一种是满足需求的免费内容，特别用户预期的结果。第二种可能是竞价排序的结果，可能付费观看，大部分用户没有付费的欲望觉得不好，少部分付费用户可能也会特别喜欢，但无论如何，前者肯定也会在搜索结果前列。

17. 网易互联网：深度学习工程师

啊，面到最后没时间了，面试官让我问问题，我就随便问了两个，然后不得不回360电话了，就说我有点事把视频关了，本来面得挺好的，哭

其他的忘了，就记得两道题

第一道n的二进制表示中有1的个数

1 2 3 4 5 6 int re = 0; while(n) { re; n = n&(n-1); } 然后分析复杂度，最后提示下分析出来了log(1+n)

然后分析平均复杂度，我以为从1 到int_max的所有复杂度求平均。所以怎么都分析不对。

最后才知道是每个的复杂度，晕，面试官告诉我是log前面的系数是0.5。

第二道：

1、建个链表

2、打印链表

3、反转链表

反转链表写的不好，左右边界各判断了一次，正常情况下只判断一次就好，但面试官说也OK，多做一次时间影响不大，结果正确就好。

4、排序链表

做的是真难受，臭牛客，哼哼。写错个变量都指不出来，改bug改到头秃。

排序链表写的是链表快排，最后发现复杂度不是nlog(n)，因为我L部分的尾部没有指向mid(base)，导致我最后写了个找L部分的尾部，把这一步优化了就没问题了，但是面试官说也行吧排序的结果不会错。

最后问问题的时候，我一边问一边调试，最后终于把链表快排调对了。然后和面试官说我调出来了，就匆匆结束了这次面试，很难过。因为马上360就是二面，我总不能为一面放弃二面把，这里我情商不够处理的不好，哎，难受。面试官人都挺好的，都是我的问题。

面试经验肯定是面的越多越丰富的，从最初乐鑫的笔试挂，到字节跳动笔试不会写输入流（第一道题我本地1分钟就A了，然后不会写输入流，试了15分钟，然后写了第4题，结果本地能过线上报编译错误，我就很生气了，何况这个输入流更复杂我就直接放弃了）笔试直接挂，到现在面试一点也不紧张，可以和面试官愉快吹牛逼了，所以说多点经历也是挺好的（补充，这次字节笔试3.6/4,还可以）

##部分已挂的公司，吐槽一下： OPPO 简历挂？显示简历过，没有通知面试，可能原因是没填内推码，身边的字节大佬也和我一样简历挂。 . .问了去面试的算法同学面试题目婴儿难度。还有提前批没过，但是简历状态还有，是已处理，不能再次投递。 . . VIVO 笔试挂。 .我真没想到笔试还能挂，不过VIVO SP给的还不错，问的问题也不能说难？没中奖呀难受很气，想想要不要投步步高？三顾茅庐了要阿里内推挂（本来在池子里，然后部门的那个人发邮件给你内推，内推完刷新界面挂，可能原因是我扫了内推连接，但是我一般是不选择内推，想一想阿里内推人也不容易，互相体谅吧）还有一个不知道哪里的公司挂了我简历，原因是简历是牛客上创建的，都不知道什么时候创建的，简历上面很干净。 .

18-28 作者：工大菜鸡链接：(https://www.nowcoder.com/discuss/295287)

18. 顺丰sp和ihandy牛客专场：

开篇就是吐槽，我为什么写这个？不是因为顺丰面试有多难，而是顺丰答应给我的二面，到现在都没给。 . .从8月1号顺丰给了我人生中第一次公司面试到9月28号我结束秋招，在这期间顺丰不断推迟二面时间，现在又给我推到了10月中旬，不得不说，顺丰的hr还真是佛系呢。 ihandy这货更狠，给我答应的一面到现在都没兑现，每次打电话过去问hr，都是同一个回答：马上帮您安排，然后我就继续傻傻的等一两个星期，循环往复。

顺丰一面：

1.自我介绍，为什么转行，你原来实验室干的什么？：因为喜欢算（qian）法（duo），原来实验室干的导航制导与控制；

2.介绍比赛，做了哪些数据的清洗，数据增强的处理？作了哪些特征？怎样提取特征的，为什么会想到这个特征呢？：balabala如实说，还说目前进入了复赛，正在复赛准备阶段XXXXX啥的；

3.我看你比赛用到了xgboost和lightGBM，那说下XGboost原理吧：额……不会；

4.那说下LightGBM吧：咳咳，也不会；

4.额那说下GBDT总行了吧：额……还是不会；

5.那你会啥？我：LR。（面试官快哭了TT）；

6.那好吧那你说说LR吧：balabala；

7.你听过CATboost吗？我：没。（面试官再一次哭了）；

8.说说LSTM的原理：balabala还口述了输入门，更新门，输出门的公式；

9.你有什么想了解顺丰的吗？我：X$Y*&^%(&%@1！2￥……；

我知道我答的很菜，但我还是厚着脸皮问了面试官我的表现咋样，能否就我的面试情况和简历提点建议？后面每一次我视频面试我都会向面试官问这个问题，他们也都会热心的给我提出建议，帮我修改简历，收获很多。

结果：没想到一面给我过了，但是二面迟迟不到。

19. 滴滴牛客sp专场（二面挂）:

惭愧，当时在面试的时候还以为滴滴是小公司，问面试官问题的时候，我居然问了滴滴的业务存活情况……

滴滴一面:

1.自我介绍，转行之类的问题；

2.了解那种算法挑一种介绍下：我说了LR，刚说到交叉熵这儿，面试官打断：那你说说LR为什么用交叉熵作为loss函数。我：因为lr从概率密度函数推导出来的对数极大似然函数就是交叉熵函数。面试官说：不全对，其实mse是万能的loss函数，每个模型都可以用mse作为loss函数的，那为什么lr不用mse呢？我：不几道。面试完了才想明白，mse的导数里面有sigmoid函数的导数，而交叉熵导数里面没有sigmoid函数的导数，sigmoid的导数的最大值为0.25，更新数据时太慢了；

3.说说XGB：在上次顺丰面完后，我仔细学习了一遍xgb，这一次大致回答上了面试官的问题，我说了GBDT，再从XGB是如何改进GBDT的角度引入了XGB的一些概念，比如预排序什么的，引入正则项和二阶泰勒展开什么的；

4.介绍比赛，介绍如何分工的，如何构建特征的，如何选择这些特征的；

5.说下常见的处理过拟合手段有哪些？我说了l1，l2，神经网络里的dropout，增加数据量等等，面试官问还有吗？我：不知道了。其实后来才知道bagging和boosting也是降低过拟合的手段，以前还以为仅仅是种特殊的模型。

同样向面试官问了我的表现情况以及如何改进，面试官也热心的提出了建议。

滴滴二面:

1.自我介绍，大致介绍项目。

2.聊比赛，聊人生。 . . . .大概聊了30多分钟。

3.问你会不会什么操作系统，数据库啥的，c++会不会。答：都不会

二面很自然的就挂了，从滴滴的面试可以看出，其实国内的很多公司都挺看中开发能力的，只会python和跑跑模型应该达不到绝大多数公司的要求。

20.快手牛客sp专场（二面挂）

快手一面：

1.基础问题都是老生常谈，问题和回答略了

2.算法题：求最长回文子串，leetcode原题，动态规划求解最好，但我当时不会，用的是中心展开法，勉强做了出来。

快手二面

1.上来一道leetcode上的hard算法题：求最小编辑距离。不会，直接gg

2.其他闲聊，聊人生

大概等了10多天，官网上给我挂了

21.依图（一面挂）

依图

是我最惨的一次面试，面试官笑眯眯的，也没让我自我介绍，上来四到算法题，一道一道来的那种，题目都忘了，只记得每道都把我摁在地上摩擦，差不多情况就是这样：

面试官：出道算法题吧，第一道：XXXX。

我思索10分钟：不会；

面试官：那我们做第二道吧：XXXX。

我又思索10分钟：不会……；

面试官：那再来一道：XXXX。

我寻思我都这么惨了放过我让我走吧求你了，于是思索了两分钟说：还是不会……；

面试官：那再来一道：XXXX。

我：gun！

后来视频面试结束的时候，我专门去查了这几道题目，他们都有一个统一的解法，那就是动态规划，抱歉我之前真没听过动态规划啊啊啊啊啊，我从此下定决心，进行dp的专项练习。

22.腾讯（一面挂，好后悔没有抓住唯一一次进鹅厂的机会）

Tencent

其实面试官问的问题都很简单，但是当时比赛刚做完，非常疲惫，不想学习，没有学习新的东西，也没复习旧的东西，就这样躺尸了两天，然后腾讯的技术面试官晚上打来电话面试：

1.自我介绍，介绍比赛

2.看你用到了朴素贝叶斯，说下原理吧。我心想这还不简单，刚要张嘴，才发现坏了，啥叫朴素贝叶斯来着？ J'ai oublié!我就支支吾吾的说：用了贝叶斯公式，然后加上了观测独立假设，面试官无语……

3.说下xgb，lgb和gbdt吧。这个我会，由于前面问了很多了，不用复习也能张口就来。

4.我看你的另一个比赛用了bert和CRF，说说CRF的原理吧。我：……不会（后悔没看）

5.那说下bert的原理吧。我：……还是不会（好后悔啊，太懒了，还是没看）

后面balabala的问了一堆，我都回答上了，但是前面这几个没回答上的太伤了，一面挂

23.远景（四面挂，boss面挂的，真是挂的莫名其妙……）

一面，二面，三面（都超级水）：

都是随便介绍项目，问一些基础的问题，没啥难的，印象深刻的是二面面试官问到最后突然让我用英文介绍下比赛里面是如何选择特征的，我用我的工地散装英语一顿乱说，结束时面试官说嗯很不错，我内心：靠，你压根就没听吧！

四面（boss面）：

四面是boss面，现场面的，聊人生，跟我聊了一个半小时，全程也穿插问些问题，我都回答上了，跟boss聊得非常好，然后就给我莫名其妙的挂了……，我想原因应该是boss临走前给我说了一句：你需要多注重工程能力。他可能嫌我工程项目很少吧。

24.百度（一面挂）

1.百度笔试：

百度的笔试就令人印象深刻：

选择题啥都考，很杂，操作系统，数据库，c++，python，机器学习，深度学习啥都考

两道问答题，其中有一问印象深刻：说说针对中文，BERT有什么可以改进的地方。我心想：你丫不就是想吹自己的ERNIE嘛，我就写了ERNIE针对BERT做出的改进，基于知识的mask训练方式，基于知识图谱的改进等等

一道设计题，让你设计一个系统：可以写出春联，必须满足他的要求，平仄音节都要对上，我直接BERT+CRF+GPT一顿乱写。

编程题：RGB括号，我猜应该是道dp题吧，链接：https://www.nowcoder.com/discuss/254095

想看的童鞋可以看一看，无视我的答案就好，我到现在都不知道我的答案对不对。

2.百度一面：被疯狂摩擦，问的非常细：

1.红黑树的几个特点。只答上两个，其实我根本不会

2.python的装饰器@的用法。 Ne le fera pas

3.编程，写一个函数，实现python的继承，数据的交换，类中的全局变量等等。写上了一半。

4.快排（不能用简单粗暴的那种，要空间复杂度最低的）和堆排序（必须用最小堆实现）。 Instead of asking you to write code, I give you an array and let you directly use the ideas of quick sort and stack sort to demonstrate it element by element to him. I answered this question. Fortunately, I have implemented it before and understood it .

5.算法题dp两道：最长公共子串，最长公共子列，都是dp题，幸好专门看了九章算法，专项学习了dp，简单或者中等的dp题还是可以一战的，这两道也是lintcode上的原题，有兴趣的童鞋可以查查。

6.介绍xgb，我说到“xgb的预排序是相对于暴力求解的加速”这儿，面试官打断了我，反问我：那具体是为什么加速了呢？一个特征下的数据，没有预排序和预排序了，不都得遍历一遍才能求解出最优分裂点吗？

这个问题给我干蒙了，其实这个问题我之前思考过，但是太懒了，心里不断麻醉自己面试官不会问得这么细，就直接忽略了，没再去想。百度面试完以后我看了原论文的伪代码才明白为什么。所以再次建议尽量能读一读原paper。

7.介绍下xgb是如何调参的，哪一个先调，哪一个后调，为什么？哪几个单独调，哪几个放在一组调，为什么？哪些是处理过拟合的，哪些是增加模型复杂程度的，为什么？我寻思你十万个为什么呢？总之就是被为什么问的头昏脑涨，出了门我就知道肯定挂了。

25.搜狗（面试流程结束）

1.搜狗一面（一个半小时摩擦系列）：

1.lr为什么用sigmoid函数作为概率函数。我：lr是基于伯努利分布为假设的，伯努利分布的指数形式就是sigmoid函数，而且sigmoid函数可以将数据压缩到0-1内，以便表示概率。

2.介绍下word2vec，说说word2vec和fasttext的区别。我：balabalabala，说的貌似还行，面试官点头

3.印象深刻的推导：

推导下word2vec里面的一个模型CBOW吧。后悔没看，哭了，我说不会。

那推导下SVM吧。这个我会，推出来了，但是到对偶条件这里，面试官问为什么能用对偶条件，我没答上来，还是太菜。

那再推下lr吧。这次顺利的推了出来，面试官问的问题也回答了上来。顺利通过了。

4.算法题：求最长回文子串，没错，和前面快手一面问的笔试题一样，答上了。

5.概率题，严格来说，这道题不是我遇见的，是我同学面搜狗的时候被问到的，我觉得很有意思，而且我们都不知道答案，请大佬解答：

一共54张扑克牌，我抽了几张牌（大于2张），有两种场景： 1.我说我有小王； 2.我说我有大王；这两种情况，哪种有双王的概率更高？

这题我是一脸懵逼的，求各位大佬解答！

2.搜狗二面：

1.xgb的loss函数的推导（mse以及非mse形式），以及求解推导。

推出来了；

2.求最大连续子列和，要求时间空间复杂度最小。

很简单；

3.xgb是如何实现并行的。

保存预排序的block，用进程间的通信并行寻找最优分裂点。

4.lgb的直方图优化算法说说。

随便说了说，面试官也没深问。

5.讲比赛，讲项目。

balabalabal总之二面持续了差不多一小时

3.搜狗hr面：

没啥好讲的，聊人生，聊转行，hr说需要综合各地的信息来筛选，让我回去等消息。

26.OPPO（offer）

我整个秋招所经历的所有面试官里面，一共面了三个非常有水平的面试官（我个人觉得）：一个是远景的那个boss，微软亚研院呆了四年，百度呆了六年，google呆了六年。和我聊现在的行业形势以及各种模型的应用，很多问题都会直击要害，一语中的。和我的聊天中看出了我工程能力不足，跟我聊了一个半小时，为我未来提出了一些建议和规划，我很感谢那位大叔；第二个是百度的一面面试官，他好像就是住在我肚子里的蛔虫一样，总能在我的回答中揪出我不会的致命知识点，给我痛击，真的是怕啥他考啥，他的基础非常扎实，而且反应和判断非常迅速；第三个就是这个oppo的一面面试官，根本不问固定知识点，就问一些模型、手段、措施背后的本质并且举例说明，在你运用的实际场景中有没有见过。

1.OPPO一面：

刚开始都没让我自我介绍，直接让我说比赛。我：balabala，我介绍到CRF的时候，面试官打断我说：“你说CRF说了一大堆，那他它本质是个啥东西，我不要听那些定义，你给我说本质”。我：……支支吾吾……，说它应该是个函数，balabalaba一顿编。

然后他也没说对错，继续问：说下attention吧，我：又是一顿balabala，讲到注意力那儿的时候他问：你能举个case吗，用了attention和没用attention时候的对应的隐状态在哪些地方有区别你有去观察过吗？我：又是一顿瞎bala，他又没说对还是错。

又问我看你这里用到bilstm它和lstm的区别在哪？举例说明，用了和没用的效果。我心想：哎呦终于有个会的了，结果回答完他还是那副样子，又是啥也没说，我心想对还是错你倒是给个准信啊。

又问到了ELMo，让我说明ELMo是如何做到动态词向量的。我：把每个词输入模型，得到的隐状态相加就能得到不同的词向量；

面试官：那说下ELMo的缺点。我说：第一就是多层bilstm天生的缺点：“自己看到自己”的现象，然后举了个例子，balabala……。第二就是无法并行训练，以上两个毛病都可以用bert去改进它；

他又问其实我们可以用加入位置嵌入的方式来改进这个无法并行的问题那为什么非得用bert呢？我一想确实facebook貌似在之前就提出了位置嵌入+textcnn的方式来并行训练。完了，给自己挖坑了。于是乎我就扯了一堆bert里面self-attention的优点，哈哈哈我真是机智。

然后他依旧啥也没说，又让我介绍bert，并且问了multi-head的好处，又问我它的实际物理意义是什么？ Pourquoi pensez-vous cela ?举个case说明下。我用尽了我毕生瞎编的本事，凭借着我自己的一点理解硬是说了10分钟，然后结束了是对是错他还是啥也没说……………………

又让我写LSTM的公式，勉强写上了

又问了我一个实际场景问题：用一个模型去分类一堆数据，在training阶段就无法收敛，反复震荡，有可能是什么原因，你有没有在实际场景中遇见过？

我：可能数据是标注错误的或者是随机数据，面试官补刀：假设数据没问题，那是什么原因？

我：那就是模型无法拟合这个数据或者不适合做这类数据的分类，面试官再补刀：假设模型也没问题，足够复杂。

我：那有可能是优化过程陷入了局部最优，而且一直无法跳出，面试官再次补刀：假如优化过程没问题。

我：那就是正负样本极其不均，网络没法学习到东西？面试官：我没说一定是神经网络模型，而且那再假如样本正负分布是均匀的……

我：……那我真没遇见过这样的……

面试官当时貌似不太满意，跟我聊完居然把我的简历给对折了起来！我第一次见这种场面……，心想：哎呦我去凉了，可能一出门面试官就会把我的简历扔垃圾桶里了吧……。面试官让我回去等，晚上如果收到消息就是过了，没收到就是挂了。晚上感觉想哭，毕竟OPPO是我蛮喜欢的一个公司，结果快睡着了突然来了一个短信提醒，说我OPPO面试过了……，得，这下倒好，睡不着了……

2.OPPO二面（主管面）：

1.聊项目比赛，一路下来没问啥知识点，没啥大问题

2.画出ESIM这个模型的结构，并作介绍

3.面试官看我航天二院的项目跟导弹拦截有关系，是用GRNN预报弹道的，就让我介绍下GRNN的网络结构以及原理，还问预报精度怎么样。我说这个题目现在是我的毕设，还没做完呢……

面试官：哦……那你给我说说你要拦截的这个HTV-2是个啥？

我说：是一种美国的临近空间高超声速飞行器，可用于导弹上，对我国国防安全造成威胁，balabalabala……

面试官好像突然来了兴趣，一直问我导弹的事，跟个好奇宝宝一样：这个HTV-2很厉害吗？

我：点头，嗯嗯嗯

面试官：这个HTV-2有啥特点？你们用经典的方法一般是咋拦截的？balabala……

我：额……这些都是保密的……

面试官：哦，那没事了。

4.聊到后面问我有没有了解过一些其他的搜索排序算法，比如list-wise的，pair-wise的，然后给你一堆非常大的大数据，如何实现全数据的搜索排序，我凭借我的理解大致回答了一些，面试官说还不错，让我等下一面

3.hr面：

我拿起我的oppo find x给hr一顿瞎BB，意向书成功到手，虽然是白菜价，但是OPPO是我很想去的一家公司，尤其是近几年开始搞些奇奇怪怪的手机出来以后越想去了- . -。

我原以为一面二面回答的不太好的情况下OPPO也愿意要我，而且hr说今年OPPO机器学习投递的简历，光筛选后的985计算机科班硕士的就多的吓人，所以我感觉OPPO今年应该在机器学习这个岗位上招人需求有很多。没想到签约会时候问hr才得知整个哈尔滨加吉林地区，机器学习的offer只有两个……，瞬间脊背发凉……

27.58同城（口头意向，拒了）

其实能面试58我是非常意外的，因为58的笔试编程题我一道都没做出来，选择题差不多一半都是瞎猜的，甚至面试的时候，面试官还把我做错的选择题拿出来又问了我一遍，并且我还是答错了……囧，而且三个面试官都问了我：为什么编程题一道都没做？ ………好尴尬，太奇怪了！ ? 58怎么会给我面试呢？不过面试时我表现的还不错，最后也拿到了口头意向，但已经签了OPPO就给拒了。

1.58一面：

1.还是各种介绍，自我介绍，比赛，项目，为什么转行啥的。

2.我看你用了ESIM这个模型，把模型结构画一下，并且告诉我为什么有用。 Très simple.

3.算法题：一个数组中和为k的所有二元组，要求时间复杂度为O(n)。这个也很简单。

4.介绍下BERT以及CRF。老生常谈了，他也没深问。

5.算法题：最小编辑距离，没错又一次被问到了，dp常规思路，只不过需要多考虑边界条件。完美解决。

6.算法题：一块钱一瓶水，三个瓶盖能换一瓶水，问20块最多能买多少瓶水？（用编程方法解决。）面试官午饭没吃，饿的等不及了，我刚想了一分钟还没写出来，面试官说一面就到这儿吧，我以为他要把我挂了，赶快急急地说了思路，面试官说没事你一面过了，走去吃饭吧，噗.......

2.58二面：

二面大多数时候都是我在问面试官，一时间搞不清楚谁才是真面试官……问了些58的业务，以及业务中需要的模型，算法等等的。聊得很开心，当然也有些坑，面试官会穿插着问些技术问题，比如在谈到58的软件内搜索业务的时候，面试官问如何在少量数据的情况下对用户的输入进行快速的意图识别。我说了几条：可以用信息熵来确定用户输入主体，用聚类来做些简单的意图识别等等。

3.58hr面：

一个很漂亮的大姐，很亲和，又是聊人生，结束后告诉我回去等通知。

28.华为（offer，拒了）

我申请的是华为消费者bg软件部的人工智能工程师，自然语言处理/语音处理方向。我听说今年很难进华为，想进消费者更是难上加难，但是我仍然没感觉到有多难进……可能华为比较看重课业成绩和学历吧，因为我感觉我只有这个优势……

1.华为一面：

上来两到算法题，不过都是很简单的leetcode原题，题目我给忘了，但是都答上了。但是我感觉面试难度看脸，有同学就被甩了两道dp题没答上来一面就挂了。

问的问题都很基础，知识点都是前面的那些，没有什么印象深刻的问题。

2.华为二面

算法题：求一个数组中和为k的最长连续数组，暴力法解决的，面试官说没有复杂度要求。

问了槽位的概念，这个我之前真没听过，哎，还是太菜了。

问了些其他的基础问题

3.华为三面

聊人生，聊规划，圆满结束，offer到手，签约会的时候，hr说给我安排到北京了，我不太想去北京，而且薪资也不高（我听到的消费者的同学都一个均价，什么硬件研究院、智能车、无线的均价都比消费者高），而且最重要的是，他把我安排到了消费者软件部下的智慧城市这个三级部门，大概率是语音方向的，我不是特别喜欢，就给拒了。

阿里达摩院四面计算机视觉

1面(1h10min) - 电面

约定电面晚上8点半(阿里是加班到9、10点的节奏？）

Présentez-vous :

projet

主要是商汤无人车实习的项目，问我比baseline提升15个点，怎么来的。

从数据迭代、backbone、模型修改几个层面上说了下。

挑一两个有意思的优化说说，说了cascade、hdcnn的结构，为什么用这种结构。

项目中出现什么情况，怎么解决的？主要就是说小目标检测的解决方案。

对caffe源码熟悉程度。（我扯了扯源码的底层设计模式，数据流怎么流的，如何添加新层、cuda代码的细节）

question ouverte

给了一个情景，如何训练模型、调优。（题目很空，主要考察你对深度学习的理解）

根据需求（前向传播时间、模型大小），确定模型和基础网络，跑第一版模型。（举了个栗子）判断模型是否出现过拟合的情况，来决定下一步的优化方向。结果分析(confusionMatrix等)，分析问题，将论文中的方法套上去，如果没有自己创造。（又举了个栗子）

softmax、多个logistic的各自的优势？1、类别数爆炸，2、推了下softmax反向传播的公式，来对比两者的优劣。

算法(走流程题) 字符串判断是否是ipv4，c++。(可能是时间不多了，大佬想下班了)

Expérience:

全程大多都是我在说，没有太多互动。后来经过源神@邢源建议，还是要故意给面试官漏点马脚让他们来怼我们，然后再怼回去，并说明不这么做的原因，不然不好拿高评分。(卧槽，真的是套路深啊～)

2面(1h30min) - 杭州电面

projet

大佬貌似涉猎很广泛，对每一个领域都很熟悉，基本上简历中的很多细节，他都能找到点怼我。（聊了很久）

项目是从头怼到尾，主要考察对项目、深度学习的理解。

大佬对我的trickList很感兴趣，我猜想他现在做的工作和我的很相似。

Anchor大小、长宽比选取？我说了业界常用的方法(YOLO9000中的方法)，并提了一个更优的方法。

如何解决小目标：

为什么要深层、浅层featureMap concat？提了点细节和我踩的坑，需要数量级上的调整，不然深层的feature可能会被压制。

Cascade的思想? 说了下我的摸索的一个过程。改变样本分布，困难样本挖掘，能达到比较好的效果。

文字识别使用ctc loss的一些细节。

question ouverte

设计一个情景，倾斜字体检测，问我有什么好的想法？（我觉得应该是他现在遇到的问题）

数据增强，加入形变扰动。

非end-to-end版本：分别训练检测和分类，举了之前做过的一个文字识别的项目的实现。

end-to-end版本：加入仿射变换学习因子，学习字体倾斜的角度和形变。

在商汤发论文了吗？

没有，正在攒，项目比较重，但有一些work和insight，讲了下思路。（大佬听的很认真，貌似被我的故事打动了[捂脸]）

为啥要换实习？日常吹水。

评价：大佬主动评价我对模型理解挺好的，工作做的挺深的，说等下一面吧。

体会：二面面试官说话很快，思维比较敏捷，觉得和这种人讨论问题很欢畅，如果一起工作会很赞。

以后面试说话语速应该快一些，让人觉得思维比较敏捷，这个可能会有加分项吧。

3面(1h) - 电面

项目&基础

大佬应该是搞backbone模型优化的，问了我怎么迭代基础网络的版本的，日常扯论文，自己的实验结果和理解。

前两个卷积层通道数不用很多，主要是提取边缘、颜色信息，少量的卷积核足矣。

skip connection有什么好处？推了下反向传播公式，根据链式法则，梯度可以直接作用于浅层网络。

初始学习率怎么设？这个我真的没有总结过，只是说一般使用0.01～0.1。

mobileNet、shufflenet的原理？说了下原理。

为什么mobileNet在理论上速度很快，工程上并没有特别大的提升？先说了卷积源码上的实现，两个超大矩阵相乘，可能是group操作，是一些零散的卷积操作，速度会慢。

大佬觉得不满意，说应该从内存上去考虑。申请空间？确实不太清楚。

问我看过哪些前沿的论文？说了说最近两个月的优质的论文。

扯到了tripleLoss，大佬问样本怎么选择？随机，然后就被大佬嫌弃了。装逼失败，这块确实没怎么深入研究。

为什么用multiLoss？多loss权重如何选？训练普通的模型使其收敛，打印反向传播梯度的大小，这表示该task的难度，以此作为loss的权重，然后我补充说了下可以搞一个动态的loss权重，根据一段时间窗口来决定loss的权重。

question ouverte

凸优化了解吗？牛顿法、SGD、最小二乘法，各自的优势。

凸优化其他东西呢？我说只有一些零散的知识点的记忆，纯数学，没有很系统的研究。(面试官貌似数学功底很好，只能认怂)。

感觉有点虚，我尝试着往我会的地方引[捂脸]。工程上如何对卷积操作进行优化？答：傅立叶模拟卷积。大佬不满意，说那是cudnn早就实现的，还有什么优化吗？（确实不知道，甩锅给工程组）

样本不均衡怎么处理？一个batch类别均等采样，修改loss对不同样本的权重。

Expérience:

三面面试官懂得不少，不过最后还是过了，有时间凸优化还是要系统整理下。

4面(50min) - 交叉面

projet

大佬应该不是做深度学习的，应该是机器学习那块的。交流中能感觉出来对这块不是很熟。挑他不会的玩命说，至少让他看到我的工作量。

Base

SVM的KTT条件？说了说，说到SMO实在说不下去了。

GBDT和randomForest区别？原理角度，方差、偏差角度，过拟合角度，谈了谈之前打阿里天池的一些经验吧。

GBDT和xgboost区别？算法上工程上的优化，面试前专门看了，总结的不错，知乎，更多细节可以看看陈天奇的论文，我没看过[捂脸]，做机器学习的小伙伴最好看看。

算法题

求和接近于target的连续子数组。（lintcode上有类似的题）

最后说让后面应该还有个hr面。

Développer